Avainsana-arkisto: Otantakehikko

Kyselytutkimuksen luotettavuus

Päivitetty 30.4.2014

…virheet vältetään luotettavalla mittaamisella, oikeilla menetelmävalinnoilla ja onnistuneella otannalla.

Kyselytutkimuksen tavoitteena on hankkia tutkimuksen tarkoitukseen sopivaa tietoa, joka on todenmukaista ja virheetöntä. Tutkimuksen toteutuksessa virheiden osuus pyritään minimoimaan. Tätä varten keskeiset virhelähteet täytyy tunnistaa. Tutkimusraportissa virhelähteet ja niiden mahdollinen vaikutus tutkimustuloksiin täytyy raportoida kattavasti ja rehellisesti, jotta raportin lukijakin pystyy arvioimaan virheiden vaikutuksen tutkimuksen luotettavuuteen.

Keskeiset virhelähteet ovat selkeästi tunnistettavissa, jos kuvaan kyselytutkimusta seuraavan kuvion mukaisella mallilla (mallin idean olen ottanut kirjasta Groves, Fowler, Couper, Lepkowski, Singer & Tourangeau. Survey Methodology. Second Edition).

Kuvion mukaisesti virheet vältetään luotettavalla mittaamisella, oikeilla menetelmävalinnoilla ja onnistuneella otannalla.

Luotettava mittaaminen

Kyselytutkimuksen tuloksia ei tarkastella yksittäisen vastaajan osalta. On kuitenkin tärkeää, että mittaaminen on suoritettu siten että vastausten perusteella vastaaja pystyttäisiin kuvailemaan todenmukaisesti tutkimuksen kannalta olennaisten ominaisuuksien osalta. Muutoinhan kaikkien vastaajien vastauksista tilastollisesti muodostettu yhteenveto ei anna todenmukaista kuvaa otoksesta. Mittaamisen luotettavuutta heikentäviä tekijöitä ovat ainakin seuraavat:

Heikko validiteetti

Jos kyselylomakkeen kysymykset eivät mittaa sitä mitä niiden on tarkoitus mitata niin seurauksena on heikko validiteetti.

Heikko reliabiliteetti

Vastauksissa esiintyvät satunnaiset virheet heikentävät mittaamisen reliabiliteettia. Esimerkiksi

  • Eri vastaajat ymmärtävät kysymykset eri tavoilla.
  • Kaikki vastaajat eivät vastaa rehellisesti.
  • Kaikki vastaajat eivät muista vastausta oikein. Tämä on ongelma erityisesti mennyttä käytöstä koskevissa kysymyksissä.
  • Vastaukset vaihtelelevat satunnaisten tekijöiden johdosta (vastaajan mielentila, vuorokaudenaika, haastattelijan käytös jne.).
  • Vastaus kirjataan vahingossa väärin.

Jos mittaamisen reliabiliteetti on heikko, niin siitä seuraa myös heikko validiteetti. Eihän virheellisillä vastauksilla voida mitata luotettavasti sitä mitä on tarkoitus mitata. Päinvastainen ei välttämättä pidä paikkansa. Mittaamisen validiteetti voi olla heikko, mutta silti vastaukset voivat olla virheettömiä ja totuuden mukaisia esitettyihin kysymyksiin nähden.

Lisätietoa ja esimerkkejä mittaamisen validiteetista ja reliabiliteetista artikkelissani Mittaamisen luotettavuus.

Oikeat menetelmävalinnat

Yksittäisten vastaajien vastauksista muodostetaan otosta kuvaileva yhteenveto käyttäen taulukoita, tunnuslukuja ja kuvioita. Virheelliset menetelmävalinnat tai laskuvirheet heikentävät luotettavuutta. Tilastollisten menetelmien opiskelulla ja huolellisella työskentelyllä tämän vaiheen virheet voidaan välttää. Jos olet epävarma menetelmävalinnoista, niin kysy asiantuntijalta.

Onnistunut otanta

Otoksen perusteella muodostetaan kuva koko perusjoukosta. Jos otos ei vastaa ominaisuuksiltaan perusjoukkoa, niin otoksen perusteella tehdään virheellisiä päätelmiä perusjoukosta. Tässä yhteydessä käytetään usein nimitystä ulkoinen validiteetti. Jos otoksen tulokset ovat heikosti yleistettävissä perusjoukkoon, niin ulkoinen validiteetti on heikko. Otoksen onnistumista uhkaavat ainakin seuraavat tekijät:

  • Peittovirhe: Otos valitaan usein todellisen perusjoukon sijasta niin kutsutusta otantakehikosta. Otantakehikko ei sisällä välttämättä koko perusjoukkoa ja toisaalta otantakehikkoon saattaa kuulua perusjoukkoon kuulumattomia. Otantakehikosta seuraavaa virhettä kutsutaan peittovirheeksi. Tästä asiasta lisää artikkelissani Otantamenetelmä.
  • Otantamenetelmä: Jos otantamenetelmä on jokin muu kuin arvonta tai systemaattinen otanta, niin seurauksena voi olla vino otos, joka ei vastaa perusjoukkoa. Tästä asiasta lisää artikkelissani Otantamenetelmä.
  • Otantavirhe: Vaikka otanta valitaan arpomalla tai systemaattisella otannalla, niin otoksen kokoonpano vaihtelee otoksesta toiseen. Tätä vahtelua kutsutaan otantavirheeksi. Otantavirhe on sitä pienempi mitä suurempaa otosta käytän. Tästä asiasta lisää artikkelissani Otoskoko. Tilastollisen päättelyn menetelmät (virhemarginaalin laskeminen, hypoteesin testaus) liittyvät otantavirheen huomioimiseen tulosten esittämisessä.
  • Kato: Vastaamatta jättäneet voivat olla erilaisia kuin vastanneet. Tällöin kadosta seuraa virhettä tuloksiin. Kyselytutkimusten vastausprosentit ovat usein valitettavan alhaisia, joten kato voi aiheuttaa merkittävän virheen tuloksiin. Tästä asiasta lisää artikkelissani Kato.

Edellä mainituista peittovirhe ja kato ovat uhkana myös kokonaistutkimuksessa, jossa tieto pyritään keräämään koko perusjoukolta.

Kannattaa huomata, että tutkimustulokset voivat olla käyttökelpoisia vaikka otanta ei olisikaan kovin onnistunut:

Esimerkki: Oleta, että asiakaskyselyssä iso joukko asiakkaita pitää myymälän siisteyttä tärkeänä, mutta arvioi myymälän epäsiistiksi. Riippumatta otannan onnistuneisuudesta nämä ovat todellisia vastaajia ja todellisia mielipiteitä, joiden pohjalta kannattaa ryhtyä toimenpiteisiin siisteyden parantamiseksi.

Mainokset

Otantamenetelmä

Päivitetty 21.10.2013

Otantakehikko on joukko, josta otos oikeasti valitaan. Otantakehikko saattaa poiketa enemmän tai vähemmän perusjoukosta.

Kokonaistutkimuksessa tieto kerätään koko kiinnostuksen kohteena olevasta joukosta eli perusjoukosta. Jos kokonaistutkimus ei ole mahdollinen tai tarkoituksenmukainen, niin tieto voidaan kerätä vain osasta perusjoukkoa (otos). Otantamenetelmällä on ratkaiseva vaikutus siihen kuinka luotettavasti otoksen avulla voidaan kuvata perusjoukkoa.

Otantakehikko

Otantakehikko on joukko, josta otos oikeasti valitaan. Otantakehikko saattaa poiketa enemmän tai vähemmän perusjoukosta.

Esimerkki. Oletetaan, että perusjoukko on HAAGA-HELIA ammattikorkeakoulun Pasilan toimipisteen liiketalouden opiskelijat. Jos toteutan kyselytutkimuksen Pasilan toimipisteen kahviossa, niin otantakehikko on Pasilan toimipisteen kahviossa asioivat. Otantakehikko poikkeaa ainakin kahdella tavalla perusjoukosta:

  • Osa perusjoukkoon kuuluvista ei koskaan asioi kahviossa. Jos nämä otantakehikosta puuttuvat ovat kyselytutkimuksessa kysyttävien asioiden osalta erilaisia kuin kahviossa asioivat, niin otos ei anna oikeaa kuvaa perusjoukosta.
  • Pasilassa on myös muita koulutusohjelmia kuin liiketalous, joten otantakehikko sisältää myös muita kuin liiketalouden opiskelijoita. Tämän ongelman voin ratkaista kysymällä ensimmäiseksi, onko vastaaja liiketalouden opiskelija?

Arvonta

Jos perusjoukosta on saatavilla luettelo, esimerkiksi asiakasrekisteri, niin arvonta on erinomainen otoksen valitsemistapa. Kyselytutkimusten osalta arvonta soveltuu postikyselyihin, sähköpostikyselyihin ja puhelinkyselyihin edellyttäen, että luettelossa on tarvittava yhteystieto (osoite, sähköpostiosoite, puhelinnumero). Arpomisen voin suorittaa esimerkiksi Excelillä. Tästä lisää artikkelissani Otoksen arvonta Excelillä.

Systemaattinen otanta

Systemaattinen otanta on mahdollinen, jos perusjoukko on ”jono”. Jonosta voidaan valita esimerkiksi joka kymmenes (aloituskohta pitää arpoa ensimmäisen kymmenen joukosta). Tällöin suoritetaan systemaattinen otanta, jossa poimintaväli on 10. Systemaattinen otanta soveltuu esimerkiksi liikennetutkimuksiin (pysäytetään autoja poimintavälin mukaisesti), ovensuukyselyihin (pysäytetään haastateltavia poimintavälin mukaisesti) ja laadun valvontaan (tarkastetaan tuotteita poimintavälin mukaisesti). Systemaattista otantaa voin käyttää myös, jos perusjoukosta on saatavilla luettelo (tällöin myös arvonta on mahdollinen).

Jos otantakehikko ei vastaa ajan suhteen koko perusjoukkoa, niin tuloksena voi olla vino otos.

Esimerkki: Jos ALKOn myymälän asiakastutkimus suoritetaan ovensuukyselynä maanantaina aamupäivällä, niin vastaajat eivät luultavasti edusta myymälän koko asiakaskuntaa. Otantakehikko on tässä liian suppea ja seurauksena on todennäköisesti vinoutunut otos.

Edellisen esimerkin tapauksessa sopivan otantakehikon valitsemiseksi kannattaa käyttää kaikkea saatavilla olevaa taustatietoa erilaisten asiakkaiden jakautumisesta eri ajankohdille. Toki on myös mahdollista rajata perusjoukkoa. Edellisen esimerkin tapauskessa perusjoukko voidaan rajata maanantai aamupäivän asiakkaisiin.

Ositettu otanta

Otoksen edustavuutta tutkimuksen kannalta tärkeän avainmuuttujan suhteen voidaan parantaa ositetulla otannalla. Tällöin avainmuuttujan jakauma perusjoukossa täytyy olla etukäteen tiedossa.

Esimerkki. Oletetaan, että perusjoukko on HAAGA-HELIA ammattikorkeakoulun opiskelijat. HAAGA-HELIAssa on useita koulutusohjelmia. Koulutusohjelmien opiskelijamäärät ovat tiedossa. Voin ottaa otoksen kustakin koulutusohjelmasta (esimerkiksi arpomalla) siten että otoskoot ovat suhteessa koulutusohjelmien opiskelijamääriin. Eri koulutusohjelmista otetut otokset muodostavat kokonaisotoksen, joka on siis valittu ositettua otantaa käyttäen.

Näyte

Jos tutkittavat valitaan jollain muulla tavalla kuin arpomalla tai systemaattisella otannalla, niin valittua joukkoa on syytä kutsua näytteeksi. Näytteen perusteella ei yleensä voi tehdä yhtä luotettavia yleistyksiä laajempaan perusjoukkoon kuin otoksen perusteella. Otoksen edustavuuden takeena on sattuma: Jokaisella perusjoukon edustajalla on tiedossa oleva todennäköisyys tulla valituksi otokseen. Riittävän suurta otoskokoa käytettäessä sattuma huolehtii siitä, että otos edustaa hyvin perusjoukkoa.

Harkinnanvarainen näyte

Harkinnanvarainen näyte syntyy silloin kun näytteen valinnassa käytetään sattuman sijasta tutkijan harkintaa. Harkinnanvarainen näyte edustaa parhaassa tapauksessa hyvin perusjoukkoa, mutta pahimmassa tapauksessa näyte kuvastaa tutkijan pyrkimystä saada tutkimuksesta tietynlaisia etukäteen päätettyjä tuloksia.

Itsevalikoitunut näyte

Iltapäivälehden nettisivulla olevaan kyselyyn vastanneet muodostavat itsevalikoituneen näytteen. Itsevalikoitunut näyte ei yleensä ole edustava otos mistään järkevästä perusjoukosta.

Dokumentointi

…otoksen/näytteen poimintamenetelmä täytyy dokumentoida mahdollisimman yksityiskohtaisesti.

Olipa sitten kyseessä otos tai näyte, niin tulosten lukijalle täytyy antaa mahdollisuus arvioida otoksen/näytteen edustavuutta. Tämä tarkoittaa sitä, että otoksen/näytteen poimintamenetelmä täytyy dokumentoida mahdollisimman yksityiskohtaisesti. Kaikki tutkijan tekemät valinnat täytyy kirjoittaa näkyviin perusteluineen.