Kirjoittajan arkistot: Aki Taanila

Korrelaatio – lisätietoa

Päivitetty 19.4.2019.

Kovarianssi

Kahden muuttujan, x ja y, välisen suoraviivaisen riippuvuuden voimakkuutta voidaan mitata laskemalla kovarianssi:

kovar

Osoittajassa lasketaan x:n ja y:n arvojen poikkeamia keskiarvostaan, kerrotaan poikkeamat keskenään ja lasketaan tulot yhteen. Lopuksi jaetaan vapausastemäärällä (otoskoko-1), jolloin saadaan keskimääräinen poikkeamien tulo eli kovarianssi. Yksi vapausaste on menetetty keskiarvon laskennassa. Huomaathan, että muuttujan kovarianssi itsensä kanssa on sama kuin varianssi. Seuraavassa yritän perustella, miksi kovarianssi sopii suoraviivaisen riippuvuuden mittaamiseen?

Jos hajontakaavioon piirretään pystyviiva kuvaamaan x-arvojen keskiarvoa ja vaakaviiva kuvaamaan y-arvojen keskiarvoa, niin viivat rajaavat neljä neljännestä:

kovarianssinperustelu

  • I neljänneksessä x:n ja y:n poikkeamat keskiarvostaan ovat positiivisia ja näin ollen poikkeamien tulo on positiivinen.
  • III neljänneksessä x:n ja y:n poikkeamat keskiarvostaan ovat negatiivisia ja näin ollen poikkeamien tulo on positiivinen.
  • II neljänneksessä x:n poikkeamat keskiarvostaan ovat negatiivisia ja y:n poikkeamat keskiarvostaan positiivisia. Näin ollen poikkeamien tulo on negatiivinen.
  • IV neljänneksessä x:n poikkeamat keskiarvostaan ovat positiivisia ja y:n poikkeamat keskiarvostaan negatiivisia. Näin ollen poikkeamien tulo on negatiivinen.

Jos havainnot keskittyvät I ja III neljännekseen, niin kovarianssi on positiivinen (vasemmanpuoleinen kuva). Jos havainnot keskittyvät II ja IV neljännekseen, niin kovarianssi on negatiivinen. Jos havainnot jakautuvat tasaisesti kaikkiin neljänneksiin, niin kovarianssi on likimain nolla.

Pearsonin korrelaatiokerroin

Eri tyyppisten muuttujien välisiä kovariansseja ei voi vertailla keskenään, koska muuttujien mittayksiköt vaikuttavat kovarianssin arvoon. Vertailun mahdollistamiseksi lasketaan kovarianssia hyväksi käyttäen Pearsonin korrelaatiokerroin, joka on muuttujien mittayksiköistä riippumaton tunnusluku. Puhuttaessa korrelaatiokertoimesta tarkoitetaan yleensä juuri Pearsonin korrelaatiokerrointa. Pearsonin korrelaatiokerroin lasketaan jakamalla kovarianssi keskihajontojen tulolla.

korrelaationkaava

Muuttujien järjestys (kumman valitset x-muuttujaksi, kumman y-muuttujaksi) ei vaikuta korrelaatiokertoimen arvoon. Keskihajontojen tulolla jakaminen normittaa korrelaatiokertoimen sellaiseksi, että se voi saada ainoastaan arvoja -1:n ja +1:n väliltä.

korrelaationarvot

  • Korrelaatiokertoimen arvo +1 saavutetaan silloin, kun kaikki hajontakaavion pisteet sijaitsevat samalla nousevalla suoralla.
  • Korrelaatiokertoimen arvo -1 saavutetaan silloin, kun kaikki pisteet sijaitsevat samalla laskevalla suoralla.
  • Korrelaatiokertoimen arvo 0 merkitsee, ettei muuttujien välillä ole lainkaan suoraviivaista riippuvuutta. Tällöin muuttujien välillä voi toki olla muunlaista kuin suoraviivaista riippuvuutta.

Mitä kauempana korrelaatiokerroin on nollasta, sitä voimakkaammasta suoraviivaisesta riippuvuudesta on kyse.

Korrelaatiokertoimen merkitsevyyden testaaminen

Korrelaation merkitsevyyden testaamiseen liittyvän p-arvon laskenta perustuu seuraavaan testimuuttujaan:

korrelaatiotestimuuttuja

Voidaan osoittaa, että korrelaation ollessa nolla kyseinen testimuuttuja noudattaa Studentin t-jakaumaa vapausastein n-2. Lisätietoa Studentin t-jakaumasta englanninkielisessä Wikipediassa Student’s t-distribution. P-arvo on  todennäköisyys saada kyseisestä t-jakaumasta testimuuttujan suuruinen tai vielä kauempana nollasta oleva arvo. Mitä pienempi p-arvo, sitä enemmän saadaan tukea sille, että korrelaatio on nollasta poikkeava.

Vakiintuneen tavan mukaisesti alle 0,05 (5 %) suuruista p-arvoa pidetään riittävänä näyttönä perusjoukossa esiintyvän korrelaation puolesta.

Voit käyttää laatimaani laskentapohjaa testaa_korrelaatio.xlsx p-arvon ja luottamusvälin laskentaan. Lähtötietoina tarvitaan korrelaatiokerroin ja otoskoko.

Korrelaatiokertoimen luottamusväli

Korrelaatiokertoimen luottamusvälin laskeminen on hankalahko tehtävä. Excel-pohja testaa_korrelaatio.xlsx laskee luottamusvälin alarajan ja ylärajan, kun lähtötietoina on korrelaatiokerroin ja otoskoko. Laskentapohjassa käytän kaavaa, jonka johtamisen löydät Ilkka Mellinin (2006) monisteesta Tilastolliset menetelmät: Regressioanalyysi sivulta 256.

Khiin neliö -testi – lisätietoa

Päivitetty 25.4.2019.

Tämä artikkeli sisältää lisätietoa artikkeliin Ristiintaulukointi ja khiin neliö -testi.

Khiin neliö -testimuuttujan laskemiseksi tarvitaan havaitut frekvenssit ja odotetut frekvenssit. Testimuuttuja lasketaan kaavalla:

khinelio

Kaavassa i edustaa yksittäisen havainnon järjestysnumeroa ja n havaintojen kokonaismäärää. Kaavassa Oi edustaa havaittua frekvenssiä (Observed) ja Ei odotettua frekvenssiä (Expected). Khiin neliö -testimuuttujan arvo on sitä suurempi mitä enemmän havaitut frekvenssit poikkeavat odotetuista frekvensseistä. Voidaan osoittaa, että khiin neliö -testimuuttuja noudattaa likimain khiin neliö -jakaumaa vapausastein
(rivien määrä -1)×(sarakkeiden määrä -1)

Jos perusjoukossa riippuvuutta/eroa ryhmien välillä ei ole (nollahypoteesi pitää paikkansa), niin suuret khiin neliö -testimuuttujan arvot ovat epätodennäköisiä.

khijakauma

Kuvio 1. Khiin neliö -jakaumia eri vapausasteilla k (Lähde: https://en.wikipedia.org/wiki/File:Chi-square_pdf.svg)

Kannattaa katsoa KhanAcademyn havainnollinen video khiin neliö -jakauamasta.

Jakaumasta voidaan laskea todennäköisyys havaitun suuruisen tai vielä suuremman testimuuttujan arvon saamiseen. Tätä todennäköisyyttä kutsutaan p-arvoksi. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi (perusjoukossa on riippuvuutta/eroa ryhmien välillä) saa tukea. Testi on yksisuuntainen, koska kiinnostuksen kohteena on ainoastaan jakauman oikea reuna. Testattavaa hypoteesia voidaan kuitenkin pitää kaksisuuntaisena:

Nollahypoteesi: Testimuuttujan arvo on 0
Vaihtoehtoinen hypoteesi: Testimuuttujan arvo on eri suuri kuin 0.

Testimuuttujan laskennassa toiseen potenssiin korotuksesta seuraa, että testimuuttuja on aina ei-negatiivinen. Tästä taas seuraa, että testaus onkin yksisuuntainen. Ei siis kannata hämmentyä, jos toisaalla väitetään khiin neliö -testiä aina yksisuuntaiseksi ja toisaalla taas khiin neliö -testin p-arvoa kutsutaan kaksisuuntaiseksi (esimerkiksi SPSS). Molemmissa tapauksissa on kyse täsmälleen samasta ja samalla tavalla laskettavasta testistä.

Khiin neliö -testistä voit lukea artikkelista Ristiintaulukointi ja khiin neliö -testi.

Kahden riippumattoman otoksen vertailu – lisätietoa

Päivitetty 25.4.2019.

Kahden riippumattoman otoksen t-testissä tarkastellaan kahden ryhmän keskiarvojen erotusta:

Nollahypoteesi: μ1 – μ2 = 0 (ryhmien välillä ei eroa)

Jos asiaa tutkitaan otosten avulla, niin käytännössä otoskeskiarvojen erotus on lähes aina nollasta poikkeava. Keskeinen kysymys: Milloin otoskeskiarvojen erotus poikkeaa niin paljon nollasta, että sitä ei voida selittää pelkästään otantavirheellä? Tämän selvittämiseksi tarvitaan tietoa otoskeskiarvojen erotusten jakaumasta.

Otoskeskiarvojen jakauma tiedetään. Otoskeskiarvojen jakauman keskihajonta, jota kutsutaan keskivirheeksi, arvioidaan jakamalla otoskeskihajonta otoskoon neliöjuurella. Varianssi saadaan korottamalla keskihajonta toiseen potenssiin.

Eri suurten varianssien testi

Kahden otoskeskiarvon erotusten jakauma voidaan johtaa otoskeskiarvojen jakaumista. Jakauman varianssi on otoskeskiarvojen varianssien summa. Näin saadaan otoskeskiarvojen erotuksen keskihajonnaksi elí keskivirheeksi

varianssiensumma

Neliöjuuren alla lasketaan otoskeskiarvojen jakaumien varianssit yhteen, jolloin saadaan otoskeskiarvojen erotusten jakauman varianssi. Ottamalla tästä edelleen neliöjuuri saadaan otoskeskiarvojen erotusten jakauman keskihajonta eli keskivirhe.

Voidaan osoittaa, että standardoitu keskiarvojen erotus (keskiarvojen erotus jaettuna keskivirheellä) noudattaa t-jakaumaa. Lisätietoa Studentin t-jakaumasta englanninkielisessä Wikipediassa Student’s t-distribution. T-jakauman tarkka muoto riippuu vapausasteluvusta. Tässä tapauksessa vapausasteluvun laskeminen on mutkikasta ja tuloksena ei yleensä ole edes kokonaisluku. Vapausasteluku voidaan arvioida niin kutsutulla Welch-Satterthwaiten kaavalla. Laskentakaavan löydät englanninkielisen Wikipedian artikkelista Welch’s t-test.

Yhtä suurten varianssien testi

Jos verrattavien ryhmien varianssit (ja samalla keskihajonnat) voidaan olettaa yhtäsuuriksi, niin voidaan käyttää niin kutsuttua puulattua t-testiä (yhtä suurten varianssien t-testi). Puulatussa t-testissä lasketaan puulattu keskihajonta. Puulattu keskihajonta edustaa kummankin ryhmän otoskeskiarvojen jakauman keskihajontaa. Puulattu keskihajonta lasketaan kaavalla

puulattuvarianssi

Neliöjuuren alla lasketaan puulattu varianssi vapausasteilla painotettuna keskiarvona otosvariansseista. Ottamalla tästä neliöjuuri saadaan puulattu keskihajonta.

Keskiarvojen erotusten jakauman keskihajonta eli keskivirhe saadaan edellä esitetyllä kaavalla

varianssiensumma

sijoittamalla keskihajontojen s1 ja s2 paikalle puulattu keskihajonta.

Voidaan osoittaa, että standardoitu keskiarvojen erotus (keskiarvojen erotus jaettuna keskivrheellä) noudattaa t-jakaumaa vapausastein n1+n2-2.

P-arvon ja virhemarginaalin laskeminen

Testaaminen lähtee siitä perusolettamuksesta, että nollahypoteesi pitää paikkansa. Jos nollahypoteesi pitää paikkansa, niin siitä seuraa, että standardoitu keskiarvojen erotus noudattaa t-jaukaumaa tietyllä vapausasteluvulla. Nyt voidaan laskea t-jakaumasta todennäköisyys sille että otoksista saatu keskiarvojen erotus on havaitun verran tai vielä enemmän nollasta poikkeava. Jos tämä todennäköisyys on pieni, niin tämä on ristiriidassa perusolettamuksen (nollahypoteesin) kanssa. Kyseistä todennäköisyyttä kutsutaan p-arvoksi. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea.

Keskiarvojen erotuksen virhemarginaali voidaan laskea kertomalla keskivirhe t-jakauman kriittisellä arvolla. Kriittinen arvo t on sellainen, että t-jakaumassa ollaan 95 % todennäköisyydellä rajojen -t ja t välissä ja 5 % todennäköisyydellä rajojen -t ja t ulkopuolella.

tkriittinenarvo

Excelissä 95 % luottamustasoon liittyvä t-jakauman kriittinen arvo saadaan funktiolla =TINV(5%;vapausasteluku) (suom. TJAKAUMA.KÄÄNT). Keskiarvojen erotuksen luottamusvälin alaraja saadaan vähentämällä otoskeskiarvojen erotuksesta virhemarginaali. Vastaavasti luottamusvälin yläraja saadaan lisäämällä virhemarginaali otoskeskiarvojen erotukseen.

P-arvon ja luottamusvälin välillä on suora yhteys. Jos p-arvo on pienempi kuin 5 %, niin 95 % luottamusväli ei sisällä arvoa 0. Jos p-arvo on suurempi kuin 5 %, niin 95 % luottamusväli sisältää arvon 0.

Olen laatinut Exceliin laskentapohjan otantavirhe.xlsx, jonka avulla voit helposti laskea t-testin molemmilla tavoilla (erisuuret varianssit, yhtäsuuret varianssit). Lähtötietoina laskentapohjaan annetaan molempien otosten otoskoot, keskiarvot ja keskihajonnat. Laskentapohjassa on laskentakaavat puulatulle varianssille, keskivirheille, vapausasteluvuille, t-jakauman kriittisille arvoille, virhemarginaaleille, luottamusvälien alarajoille, luottamusvälien ylärajoille, testimuuttujille ja p-arvoille.

Eri ohjelmilla voit saada erisuurten varianssien testin osalta hieman poikkeavia tuloksia vapausasteluvusta johtuen. Laskentapohjassani olen pyöristänyt vapausasteluvun alaspäin lähimpään kokonaislukuun, koska laskennassa tarvittava t-jakaumaan liittyvä Excelin funktio ei osaa huomioida desimaaleja. Tämän seurauksena virhemarginaali ja p-arvo arvioidaan joissain tapauksissa hieman yläkanttiin. Erolla ei yleensä ole käytännön merkitystä. Esimerkiksi SPSS ja Excelin T.TEST-funktio laskevat käyttäen vapausasteluvun mahdollisia desimaaleja. Excelin analyysityökalujen t-testi pyöristää vapausasteluvun ainakin joissain tapauksissa ylöspäin lähimpään kokonaislukuun.

Kumpaa testiä pitäisi käyttää?

  • Jos olet epävarma, niin käytä erisuurten varianssien testiä.
  • Jos olet varma, että ryhmien varianssit ovat likimain yhtäsuuret, niin käytä yhtäsuurten varianssien testiä.
  • Jos käytössäsi on SPSS, niin voit tehdä päätöksen Levene-testin perusteella. Lue lisää artikkelistani SPSS: Kahden riippumattoman otoksen vertailu.

Jos otokset ovat isoja ja otoskoot ovat likimain samat, niin testit antavat likimain saman tuloksen. Testien tulokset voivat poiketa paljonkin toisistaan jos otokset ovat pieniä ja/tai otoskoot poikkeavat selvästi toisistaan ja/tai otosvarianssit poikkeavat selvästi toisistaan.

Yhtäsuurten varianssien testiä (puulattu testi) käytetään paljon muiden muassa seuraavista syistä:

  • Kokeellisessa tutkimuksessa on usein hyvät perusteet olettaa ryhmien varianssit yhtäsuuriksi. Jos esimerkiksi arvotaan samasta perusjoukosta kaksi ryhmää, joista toinen saa käsittelyn ja toinen ei, niin on hyvät perusteet olettaa varianssit yhtäsuurksi molemmissa ryhmissä, koska ryhmät on alun perin arvottu samasta perusjoukosta.
  • Oppikirjoissa puulattu testi esitetään usein ykkösvaihtoehtona tai jopa ainoana vaihtoehtona. Tähän lienee historiallisia syitä. Erisuurten varianssien testin käyttö oli hankalaa ennen analysointiin tarkoitettujen tietokoneohjelmien yleistymistä. Ilman tietokonetta vapausasteiden arviointi Welch-Satterthwaiten kaavalla on vaivalloista.

Keskiarvon virhemarginaali – lisätietoa

Päivitetty 25.4.2019.

Perusjoukon keskihajonta tiedossa

Otoksesta laskettu keskiarvo vaihtelee sattumanvaraisesti otoksesta toiseen. Voidaan kuitenkin osoittaa, että eri otoksista saatavat otoskeskiarvot noudattavat likimain normaalijakaumaa. Pienillä otoksilla ehtona otoskeskiarvon normaalijakautuneisuudelle on, että muuttujan arvot ovat perusjoukossa likimain normaalijakautuneet. Isoilla otoksilla otoskeskiarvot ovat likimain normaalijakautuneet riippumatta muuttujan arvojen jakaumasta perusjoukossa (tämä sisältyy niin kutsuttuun keskeiseen raja-arvolauseeseen; voit lukea lisää englanninkielisestä Wikipediasta Central limit theorem). Käytännössä otoskeskiarvojen normaalijakautuneisuus voidaan olettaa jo otoskoosta 30 alkaen ellei muuttujan arvojen jakauma perusjoukossa ole erityisen kummallinen.

Otoskeskiarvojen normaalijakauman keskiarvo on perusjoukon todellinen keskiarvo ja keskihajonta on perusjoukon keskihajonta jaettuna otoskoon neliöjuurella. Otoskeskiarvojen keskihajontaa (perusjoukon keskihajonta jaettuna otoskoon neliöjuurella) kutsutaan keskivirheeksi (standard error).

Otoskeskiarvojen keskivirhe tarkoittaa otoskeskiarvojen keskihajontaa

Normaalijakauman ominaisuuksista seuraa, että otoskeskiarvo on 95 % varmuudella korkeintaan 1,96 keskivirheen päässä jakauman keskiarvosta eli perusjoukon todellisesta keskiarvosta.

normaali

Kääntäen, 95 % varmuudella perusjoukon todellinen keskiarvo on korkeintaan 1,96 keskivirheen päässä otoskeskiarvosta. Tällä perusteella keskiarvon virhemarginaali on 1,96 keskivirhettä.

Normaalijakaumaan liittyvä arvo 1,96 on likiarvo. Tarkemman arvon voit laskea Excelin funktiolla

=NORM.S.INV(97,5%) (suom. NORM_JAKAUMA.KÄÄNT)

Funktion argumenttina voi käyttää myös 2,5%, mutta tällöin vastaus tulee negatiivisella etumerkillä varustettuna.

Perusjoukon keskihajonta tuntematon

Edellä olevassa oletettiin perusjoukon keskihajonta tunnetuksi (keskivirhe laskettiin sen avulla). Yleensä perusjoukon keskihajonta ei ole tiedossa vaan sen sijasta käytetään otoksesta laskettua keskihajontaa. Tämä lisää epävarmuutta ja siten kasvattaa myös keskiarvon virhemarginaalia.

Keskivirhe arvioidaan jakamalla otoksesta laskettu keskihajonta otoskoon neliöjuurella. Keskivirheeseen liittyvä epävarmuus huomioidaan käyttämällä normaalijakauman sijasta otoskoosta riippuvaa Studentin t-jakaumaa. Lisätietoa Studentin t-jakaumasta englanninkielisessä Wikipediassa Student’s t-distribution. Edellä esiintynyt 1,96 oli normaalijakaumaan liittyvä arvo. Vastaava t-jakauman arvo saadaan Excelin funktiolla

=T.INV(97,5%;n-1) (suom. T.KÄÄNT)

Toisena argumenttina on niin kutsuttu vapausasteluku n-1 (n=otoskoko).

Esimerkiksi otoskoolla 101 saadaan Excelin funktiolla =T.INV(97,5%;100) tulokseksi noin 1,98. Näin ollen otoskoolla 101 virhemarginaali on noin 1,98 keskivirhettä.

Usein virhemarginaalin sijasta ilmoitetaan luottamusväli. Luottamusvälin alaraja saadaan vähentämällä otoskeskiarvosta virhemarginaali. Luottamusvälin yläraja saadaan lisäämällä otoskeskiarvoon virhemarginaali.

Vapausasteluku

Vapausasteluku tarkoittaa vapaiden havaintojen lukumäärää. Edellä vapaiden havaintojen lukumäärä on yhtä pienempi kuin otoskoko (n-1). Tämä selittyy sillä, että keskivirheen arviointiin tarvitaan keskiarvoa, jonka laskemisessa menetetään yksi vapausaste. Keskiarvon laskemisen jälkeenhän vain n-1 havaintoa voivat vaihdella vapaasti ja viimeinen n:s havainto määräytyy keskiarvon perusteella.

Vapausasteluku liittyy läheisesti keskihajonnan laskentakaavassa jakajana käytettävään arvoon n-1.Otoksen havainnot ovat keskimäärin lähempänä otoskeskiarvoa kuin todellista perusjoukon keskiarvoa, koska otoskeskiarvo on laskettu otoksen havainnoista. Keskihajonnan ja keskivirheen laskennassa lasketaan havaintojen poikkeamia otoskeskiarvosta. Koska nämä poikkeamat ovat keskimäärin pienempiä kuin poikkeamat todellisesta perusjoukon keskiarvosta, niin keskihajonta ja keskivirhe tulee arvioiduksi liian pieneksi. Käyttämällä keskihajonnan kaavassa jakajana vapausastelukua n-1 otoskoon n sijasta saadaan parempi arvio perusjoukon keskihajonnalle.

Hypoteesin testaus

Otoksen avulla voidaan suorittaa hypoteesin testaus. Yhtä keskiarvoa koskevassa kaksisuuntaisessa testauksessa hypoteesit ovat:

Nollahypoteesi: Keskiarvo = A (A on jokin luku)
Vaihtoehtoinen hypoteesi: Keskiarvo on eri suuri kuin A.

Testaus perustuu otoskeskiarvojen todennäköisyysjakaumaan. Edellä todettiin, että otoskeskiarvojen jakauman keskihajonta eli keskivirhe voidaan arvioida jakamalla otoskeskihajonta otoskoon neliöjuurella. Jakamalla edelleen otoskeskiarvon ja nollahypoteesin mukaisen keskiarvon erotus keskivirheellä saadaan niin kutsuttu testimuuttuja. Voidaan osoittaa, että testimuuttuja noudattaa t-jakaumaa vapausastein n-1 (n=otoskoko).

Hypoteesin testauksessa lähdetään liikkeelle olettaen nollahypoteesin pitävän paikkansa. Tästä olettamuksesta seuraa, että testimuuttuja noudattaa t-jakaumaa, jonka keskikohta on 0. T-jakaumasta voidaan laskea todennäköisyys saada kyseisestä jakaumasta havaitun suuruinen tai vielä kauempana nollasta oleva testimuuttujan arvo. Tätä todennäköisyyttä kutsutaan p-arvoksi. Jos p-arvo on pieni, niin tämä on ristiriidassa nollahypoteesin kanssa. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea.

Vakiintuneen tavan mukaan alle 0,05 (5 %) suuruista p-arvoa pidetään riittävänä näyttönä nollahypoteesia kumoamiseksi.

Voit laskea testimuuttujan ja p-arvon helposti käyttämällä laatimaani laskentapohjaa tiedostossa virhemarginaali.xlsx.

Luottamusvälin ja p-arvon välinen yhteys

Jos p-arvo on yli 0,05 (5 %), niin nollahypoteesin mukainen keskiarvo sisältyy 95 % luottamusväliin. Jos p-arvo on alle 0,05 (5 %), niin nollahypoteesin mukainen keskiarvo ei sisälly 95 % luottamusväliin.

PERCENTILE (PROSENTTIPISTE) – lisätietoa

Päivitetty 25.5.2022

Neljännesten ja muiden prosenttipisteiden tarkasta määrittämismenetelmästä ei ole yksimielisyyttä. Hyndman ja Fan esittelivät vuoden 1996 artikkelissaan 12 erilaista menetelmää laskea neljänneksiä ja muita prosenttipisteitä (Hyndman, R. J. and Fan, Y. (1996), “Sample quantiles in statistical packages,” The American Statistician, 50(4), 361 – 365). Vaihtoehtoisia menetelmiä on jopa enemmän kuin 12. Käytännön tilanteissa menetelmien erot ovat harvoin merkityksellisiä.

Excel 2007 ja sitä aiemmissa versioissa prosenttipisteet lasketaan PERCENTILE (PROSENTTIPISTE) -funktiolla. Laskentamenetelmänä on Hyndmanin ja Fanin esittämä menetelmä #7.

Excel 2010 ja uudemmissa versioissa PERCENTILE-funktion uusi nimi on PERCENTILE.INC (PROSENTTIPISTE.SIS). Myös vanha funktion nimi PERCENTILE (PROSENTTIPISTE) toimii edelleen. Uutena funktiona PERCENTILE.EXC (PROSENTTIPISTE.ULK) laskee prosenttipisteet Hyndman ja Fanin esittämän menetelmän #6 mukaisesti. Myös tilasto-ohjelma SPSS ja monet muut ohjelmat käyttävät tätä menetelmää.

Jos et tarvitse yhteensopivuutta aiempien Excel-versioiden kanssa, niin suosittelen funktion PERCENTILE.EXC (PROSENTTIPISTE.ULK) käyttöä.

Tietoa prosenttipisteiden ja muiden tilastollisten tunnuslukujen laskemisesta artikkelissa Tunnuslukuja.

Lineaarinen yhden selittäjän regressiomalli

Päivitetty 28.9.2020

Kahden määrällisen muuttujan riippuvuutta voin tarkastella hajontakaavion avulla. Lisäksi voin laskea lineaarisen (suoraviivaisen) riippuvuuden voimakkuutta mittaavan korrelaatiokertoimen. Lisätietoja artikkelissani Korrelaatio ja sen merkitsevyys.

Jos haluan selvittää tarkemmin riippuvuuden luonnetta tai hyödyntää riippuvuutta ennustamistarkoituksiin, niin voin mallintaa riippuvuutta lineaarisen mallin avulla.

Suoran yhtälö

Riippuvuudesta voin rakentaa matemaattisen mallin. Kahden muuttujan riippuvuutta kuvaava matemaattinen malli on lauseke, jonka avulla voin laskea toisen muuttujan arvoja ensimmäisen muuttujan arvojen perusteella. Jos muuttujien välinen riippuvuus on suoraviivainen eli lineaarinen, niin käytän mallina suoraa. Lineaarisesta mallista käytetään yleisesti nimeä lineaarinen regressiomalli ja mallina käytettävää suoraa kutsutaan regressiosuoraksi.

Suoraa voin kuvata lausekkeella y = bx + c. Lauseke kertoo miten saan laskettua y:n, kun tunnen x:n.

  • Termiä c kutsutaan vakiotermiksi. Vakiotermi kertoo, missä kohdassa suora leikkaa y-akselia (tämän näen asettamalla x:lle arvon 0, jolloin lausekkeesta jää jäljelle y=c).
  • Termiä b kutsutaan kulmakertoimeksi. Kulmakerroin ilmoittaa minkä verran y muuttuu, kun x kasvaa yhdellä yksiköllä. Laskevaan suoraan liittyy negatiivinen kulmakerroin ja nousevaan suoraan positiivinen kulmakerroin.

Esimerkki. Oletetaan, että konsultti perii palkkiota paikalle saapumisesta 100 euroa ja jokaiselta tehdyltä työtunnilta 80 euroa. Tällöin voin mallintaa konsultin kokonaispalkkiota lausekkeella y=80x+100, missä x on työtuntien määrä. Kyseisessä suoran yhtälössä

  • vakioterminä on 100 ja se ilmoittaa y:n arvon, kun x=0 (eli esimerkissämme palkkio ilman varsinaisia työtunteja)
  • kulmakerroin 80 ilmoittaa palkkion muutoksen, kun työtunnit lisääntyvät yhdellä.

Mallin lisääminen Excelin hajontakaavioon

Voin lisätä Excelin hajontakaavioon riippuvuutta kuvaavan mallin kuvaajan, lausekkeen ja selityskertoimen:

  1. Valitsen Design-välilehdeltä Add Chart Element – Trendline – More Trendline Options (Lisää kaavion osa – Suuntaviiva – Lisää suuntaviivavaihtoehtoja).
  2. Valitsen malliksi Linear (Lineaarinen).
  3. Valitsen tulostettavaksi mallin kaavan Display Equation on Chart (Näytä kaava kaaviossa).
  4. Valitsen tulostettavaksi mallin selityskertoimen kohdasta Display R-squared Value on Chart (Näytä korrelaatiokertoimen arvo kaaviossa). Huomaa, että Excelin suomenkielisissä versioissa puhutaan virheellisesti korrelaatiokertoimesta vaikka kyseessä on korrelaatiokertoimen neliö eli selityskerroin.

Yllä olevaan kuvioon olen lisännyt mainoskulujen ja myynnin välisen mallin. Löydät esimerkin Excel-tiedostosta regressio1.xlsx. Voin tulkita mallia seuraavasti:

  • Kulmakertoimesta 52,568 voin päätellä, että tuhat euroa mainoskuluissa merkitsee keskimäärin 52568 euroa myynnissä.
  • Vakiotermi 46,486 taas ilmoittaa myynnin olevan 46486 euroa, jos mainoskuluja ei ole lainkaan. Tässä tapauksessa vakiotermin antama tieto ei ole käyttökelpoinen eikä luotettava, koska mainoskulujen arvo 0 sijaitsee selvästi havaintoalueen ulkopuolella. Yleensäkään mallin käyttöaluetta ei voi laajentaa kovin paljon havaintoalueen ulkopuolelle.

Mallin avulla voin laskea esimerkiksi seuraavat ennusteet:

  • Jos mainontaan aiotaan käyttää 900 euroa, niin mallin mukainen myyntiennuste on 52,568*0,9+46,486≈93,8 eli 93 800 euroa.
  • Jos tavoitteena on 90 000 euron myynti, niin mallin mukaan mainontaan pitäisi käyttää (90-46,486)/52,568≈0,83 eli 830 euroa.

Käytännössä ennusteet kannattaa laskea Excelin FORECAST (ENNUSTE) -funktiolla, jolloin vältät kulmakertoimeen ja vakiotermiin liittyvät pyöristysvirheet. Katso tarkemmat tiedot Excel-tiedostosta regressio1.xlsx.

Selityskerroin

Äskeisessä esimerkissä selityskerroin on 0,7664 eli 76,64%. Tämä tulkitsen seuraavasti: 76,64% myynnin vaihtelusta voidaan selittää mainoskulujen vaihtelulla. Mallin tarkoituksena on selittää y:n arvojen vaihtelua x:n arvojen vaihtelulla. Selityskertoimella mitataan kuinka hyvin tässä onnistutaan.

Tarkastelen seuraavaksi, mihin selityskertoimen laskenta perustuu. Kunkin havainnon y-arvon kokonaispoikkeama y-arvojen keskiarvosta koostuu kahdesta osasta: mallin selittämästä poikkeamasta ja poikkeamasta, jota malli ei selitä. Seuraavassa kuviossa havaintopisteen kokonaispoikkeama on jaettu mallin selittämään poikkeamaan ja selittämättä jäävään poikkeamaan.

Jos merkitsen mallin selittämien poikkeamien neliöiden summaa SSR (sum of squares due to regression) ja selittämättömien poikkeamien neliöiden summaa SSE (sum of squares due to error), niin kokonaispoikkeamien neliöiden summa SST (total sum of squares) jakaantuu kahteen komponenttiin

SST = SSR + SSE

Selityskerroin on mallin selittämän vaihtelun osuus kokonaisvaihtelusta eli SSR/SST

Lineaarisessa mallissa voin laskea selityskertoimen  myös korrelaatiokertoimen neliönä. Regressiosuoran laskentamenetelmä liittyy sekin neliösummiin. Suora lasketaan pienimmän neliösumman menetelmää käyttäen. Kaikkien mahdollisten pistejoukon läpi kulkevien suorien joukosta valitaan se, jonka kohdalla neliösumma SSE (vaihtelu, jota malli ei selitä) saa pienimmän mahdollisen arvon.

Excelin funktioita

=FORECAST(x;tunnetut y;tunnetut x) -funktiolla (ENNUSTE) voin kätevästi laskea lineaariseen malliin liittyviä ennusteita. Funktio laskee x-arvoon liittyvän y-arvon regressiosuoran yhtälöä käyttäen (taustalla Excel laskee tunnettujen y:n arvojen ja tunnettujen x-arvojen perusteella regressiosuoran yhtälön).

=INTERCEPT(tunnetut y;tunnetut x) -funktiolla (LEIKKAUSPISTE) voin laskea regressiosuoran vakiotermin.

=SLOPE(tunnetut y;tunnetut x) -funktiolla (KULMAKERROIN) voin laskea regressiosuoran kulmakertoimen.

Mallin käyttäminen ennustamiseen

Mallin sopivuus

Mallin avulla voidaan ennustaa y, kun x tunnetaan tai x, kun y tunnetaan. Mallin soveltuvuus ennustamiseen riippuu selittämättömän vaihtelun osuudesta. Hajontakaaviosta voin arvioida selittämättömän, epäsäännöllisen vaihtelun suuruutta ja yli päätään mallin sopivuutta havaintoaineistoon. Mitä enemmän havainnot ”pomppivat” mallin molemmin puolin sitä enemmän ennusteeseen sisältyy epävarmuutta.

Poikkeavat havainnot

Mallit ovat herkkiä poikkeaville arvoille. Jos kuviosta erottuu selvästi muista poikkeavia havaintoja, niin niihin ei pidä suhtautua huolettomasti. Lue lisää artikkelistani Poikkeavat arvot.

Mallin käyttöalue

Havaintoja on käytettävissä vain tietyiltä muuttujan arvoilta ja mallin pätevyyttä voidaan arvioida vain havaintoalueella. Havaintoalueen ulkopuolella olevien muuttujan arvojen kohdalla en voi tietää, onko malli pätevä. Tämän vuoksi mallia ei ole perusteltua käyttää havaintoalueen ulkopuolella.

Seuraavaksi

Jos olet kiinnostunut malleista, joissa on useampia selittäviä muuttujia, niin kannattaa tutustua monisteeseeni Lineaariset regressiomallit.

Poikkeavat arvot

Päivitetty 13.1.2016.

Poikkeavat arvot ovat muista arvoista selvästi poikkeavia arvoja. Tunnistan poikkeavat arvot histogrammin (katso Muuttujan arvojen luokittelu) tai ruutu- ja janakaavion avulla.

Jos tarkastelen kahden muuttujan välistä riippuvuutta, niin tunnistan poikkeavat arvot  hajontakaaviosta (katso Korrelaatio ja sen merkitsevyys).

Miksi poikkeavat arvot ovat ongelmallisia?

Poikkeavat arvot vaikuttavat voimakkaasti keskiarvoon ja korrelaatiokertoimeen kuten seuraavista esimerkeistä ilmenee.

Esimerkki. Henkilöstön kuukausipalkat euroina ovat 1500, 1500, 1500, 1500, 1500, 2500, 4500, 4500, 5500, 5500 ja 35 000. Kuukausipalkkojen keskiarvo on yli 5900 euroa. Keskiarvo kuvaa huonosti henkilöstön palkkoja. Keskiarvo on tunnetusti herkkä poikkeaville arvoille ja tässä tapauksessa 35 000 euroa on poikkeava arvo, joka nostaa palkkakeskiarvoa. Ilman 35 000 euron palkkaa keskiarvoksi saadaan 3000 euroa.

Esimerkki. Kuukausittaisista tiedoista laadittu mainontaan käytetyn rahamäärän ja myynnin välinen hajontakaavio on seuraavanlainen:

Mainonnan ja myynnin välinen korrelaatiokerroin on 0,909. Kaaviossa on yksi selvästi muista poikkeava piste. Jos se poistetaan, niin hajontakaavio näyttää seuraavalta (vertailun helpottamiseksi akselit on skaalattu samalla tavalla kuin edellisessä kaaviossa):

Korrelaatiokerroin on tässä tapauksessa 0,978. Havaintoihin voidaan sovittaa suoraviivainen malli, jonka avulla voidaan ennustaa myynnin suuruus mainonnan perusteella. Kaavioihin on piirretty parhaiten havaintoihin sopivat suoraviivaiset mallit. Alemman kaavion tapauksessa suoraviivainen malli sovittuu havaintojoukkoon huomattavasti paremmin.

Mitä poikkeaville arvoille pitäisi tehdä?

Poikkeavan arvon kohdalla yritän selvittää, onko kyseessä virheellinen arvo, esimerkiksi väärin kirjattu? Jos kyseessä on virheellinen arvo, niin pyrin oikaisemaan sen. Jos oikaistua arvoa ei ole saatavilla, niin poistan virheellisen arvon aineistosta.

Jos poikkeava arvo ei ole virheellinen, niin pyrin löytämään selityksen poikkeavuudelle. Selityksen löydettyäni teen perustellun päätöksen arvon mukana pitämisestä tai pois jättämisestä.

Esimerkki. Oletetaan, että aiemmassa esimerkissä (mainonnan ja myynnin välinen riippuvuus) poikkeava havainto selittyy sillä, että kyseessä on joulukuu, jolloin myynti on muita kuukausia suurempi. Oletetaan, että tarkoituksena on laatia ennustemalli, jolla myynnin määrää ennustetaan mainontaan käytettävän rahamäärän perusteella normaalitilanteessa. Tällöin on perusteltua pudottaa poikkeuksellinen joulukuun havainto pois tarkasteluista.

Jos poikkeavan havainnon pois jättäminen ei ole perusteltua, niin pidän sen mukana tarkasteluissa. Tällöin suhtaudun varauksella keskiarvoon ja korrelaatiokertoimiin.

SPSS: Yksisuuntainen varianssianalyysi

Päivitetty 25.9.2020

Tarkastelen seuraavassa esimerkkidataa, jossa on testipistemääriä neljän eri koulutusohjelman suorittaneille (8 henkilöä kussakin koulutusohjelmassa). Datan tarkempi kuvaus artikkelissani Yksisuuntainen varianssianalyysi.

Aluksi on syytä huomauttaa, että data täytyy tallentaa alla näkyvän mukaisesti (näkyvillä vain aineiston alkuosa). Ryhmää varten oma sarake ja testattavaa muuttujaa varten oma sarake.

Jos epäilen käyttöedellytyksenä olevan normaalijakautuneisuuden toteutumista, niin voin käyttää Explore-toimintoa normaalijakautuneisuuden testaamiseen. Samalla kannattaa laatia boxplot-kaavio. Lue lisää artikkelistani SPSS: Explore.

Varianssianalyysiin pääsen valitsemalla  Analyze – Compare Means – One-Way ANOVA:

  • Määrittelyikkunassa valitsen ryhmittelevän muuttujan Factor-ruutuun (koulutusohjelma) ja riippuvan muuttujan Dependent List -ruutuun (testipistemäärä).
  • Valitsen Options-painikkeen takaa Descriptive, jotta saan ryhmien keskiarvot ja muita tunnuslukuja.
  • Valitsen Options-painikkeen takaa Homogeneity of variance test, jotta pääsen testaamaan varianssien yhtäsuuruutta.

Descriptives taulukosta löydän muiden muassa ryhmien keskiarvot ja keskihajonnat (Std. Deviation).

Test of Homogeneity of Variances -taulukosta voin tarkistaa, voinko olettaa ryhmien varianssit yhtäsuuriksi (tämähän on varianssianalyysin käyttöedellytys). Testitaulukon Sig. -sarakkeesta näen että p-arvo on 0,984, joka on suurempi kuin 0,05. Näin ollen tässä tapauksessa voin olettaa varianssit yhtä suuriksi (Levene-testin nollahypoteesina on, että varianssit ovat yhtäsuuret).

ANOVA-taulukosta löydän muiden muassa ryhmien välisen (356,042) ja ryhmien sisäisen varianssin (84,348). Sig.-sarakkeesta löydän p-arvon 0,014. Koska p-arvo on pienempi kuin 0,05, niin ryhmien välillä on merkitseviä eroja.

Parivertailut

Jos varianssianalyysin p-arvo on pienempi kuin 0,05, niin tiedän ainakin joidenkin ryhmiän välillä olevan merkitsevä ero. Jos haluan tarkemman tiedon, niin suoritan parivertailuja. Parivertailujen tekemiseen SPSS tarjoaa lukuisia menetelmiä. Löydän menetelmät varianssianalyysin määrittelyikkunan (Analyze – Compare Means – One-Way ANOVA) Post Hoc -painikkeen takaa. Jos et ole perehtynyt eri menetelmien eroihin, niin voit valita Bonferroni-menetelmän. Jos menetelmän valinta askarruttaa, niin netistä löydät loputtomasti artikkeleita ja keskustelua eri menetelmistä. Voit esimerkiksi aloittaa Wikipedian Bonferroni artikkelista.

Tuloksena saan Multiple Comparisons -taulukon. Taulukon Sig.-sarakkeesta näen minkä ryhmien välillä on merkitsevä ero.

Erot ovat merkitseviä koulutusohjelmien 1 ja 2 (p-arvo 0,037) sekä 1 ja 3 välillä (p-arvo 0,021).

Yksisuuntainen varianssianalyysi

Päivitetty 25.4.2019.

Varianssianalyysi on lähinnä kokeellisissa tutkimusasetelmissa käytettävä menetelmä. Varianssianalyysillä voin testata onko ryhmien (kolme tai useampia ryhmiä) keskiarvojen välillä merkitseviä eroja.

Esimerkki. Hiljakkoin työllistetyt 32 vastavalmistunutta jaetaan satunnaisesti neljään erilaiseen myyntikoulutusohjelmaan. Kuukauden koulutuksen jälkeen koulutetuille järjestetään testi, jonka pistemäärät ovat:

Onko koutusohjelmien välillä eroja? Voin tarkastella asiaa alustavasti kaavion avulla. Laadin Excelissä Scatter (Piste) -kaavion, jonka jälkeen valitsin Design (Rakenne) -välilehdeltä Switch Row/Column (Vaihda rivi tai sarake):

Huomautus: Jos ryhmien koot ovat suurempia, niin yllä olevan kaltainen kaavio ei ole havainnollinen, koska pisteet menevät liikaa päällekkäin. Vaihtoehtoisesti voin laatia viivakaavion ryhmien keskiarvoista. Isompien ryhmien kohdalla ruutu- ja janakaavio eli boxplot on havainnollinen.

Kaavion perusteella kolutusohjelmien välillä näyttää olevan eroja. Kaaviossa havaittavat erot voivat kuitenkin johtua satunnaisvaihtelusta. Varianssianalyysin avulla voin selvittää ovatko erot merkitseviä.

Excelin analyysityökalujen avulla voin laskea varianssianalyysin. Jos en ole aiemmin ottanut analyysityökaluja käyttöön, niin voit tehdä sen seuraavasti:

  • Valitsen File – Options (Tiedosto – Asetukset).
  • Valitsen Add Ins (Apuohjelmat) ja valitsen alhaalta Manage (Hallinta) -ruudusta Excel Add Ins (Excel-apuohjelmat).
  • Valitsen Go (Siirry).
  • Valitsen luettelosta Analysis Toolpak (Analyysityökalut) ja valitsen OK.
  • Tämän jälkeen löydän Data (Tiedot) -välilehdeltä analyysityökalut (Data Analysis).

Analyysityökaluista löydän Anova: Single Factor (Anova: yksisuuntainen). Täytän Anova-ikkunaan syöttöalueen (Input Range). Syöttöalueeksi valitsen kaikki testipistemäärät otsikoineen (esimerkkini tapauksessa otsikot ovat 1,2,3,4). Varmistan, että Excel hakee tiedot sarakkeittain (Columns). Lisäksi määritän, että otsikot huomioidaan (Labels in First Row).

Excelin laskemat tulostaulukot näyttävät seuraavilta:

Ylemmästä taulukosta voin lukea eri koulutusohjelmiin liittyvien testipistemäärien keskiarvot ja varianssit (keskihajonnan toinen potenssi). Ensimmäisen koulutusohjelman keskiarvo (79) on selvästi muita korkeampi.

Alemmassa ANOVA-taulukossa vaihtelu on jaettu kahteen osaan: ryhmien väliseen vaihteluun (356,0417) ja ryhmien sisäiseen vaihteluun (84,34821). Mitä suurempi ryhmien välinen vaihtelu on ryhmien sisäiseen vaihteluun verrattuna, sitä merkitsevämpiä eroja ryhmien välillä on. Tämä testataan F-testillä, jonka p-arvon voin lukea taulukosta.

Esimerkin tapauksessa ryhmien välillä on merkiseviä eroja, koska p-arvo 0,014 on pienempi kuin 0,05.

On hyvä tutustua ANOVA-taulukon johtamiseen ja erityisesti vaihtelua mittaavien neliösummien (SS, sum of squares) laskemiseen. Voit tutustua ANOVA-taulukon johtamiseen Excel-tiedoston anovakaavat.xlsx avulla. Olen laskenut tiedostoon Excelin kaavoilla kaikki ANOVA-taulukossa oleva luvut.

Käyttöedellytykset

1. Vertailtavien ryhmien täytyy olla toisistaan riippumattomat.

2. Otoskeskiarvojen täytyy olla peräisin likimain normaalijakaumasta. Jos ryhmät ovat isoja (vähintään 30), niin normaalijakautuneisuus ei yleensä ole ongelma. Jos ryhmät ovat pieniä, voin arvioida normaalijakautuneisuutta otoksen arvojen jakauman perusteella (histogrammi, ruutu- ja janakaavio). Epäselvissä tapauksissa kannattaa testata normaalijakautuneisuus SPSS:llä. Ohjeet ruutu- ja janakaavion tekemiseen ja normaalijakautuneisuuden testaamiseen SPSS:llä löydät artikkelistani SPSS: Explore.

3. Ryhmien varianssien täytyy olla likimain saman suuruisia. Jos käytössä on klassinen koeasetelma, jossa tutkittavat on jaettu satunnaisesti koeryhmään ja vertailuryhmään, niin varianssien pitäisi olla likimain saman suuruisia. Varianssien yhtäsuuruuden tarkistamiseen sopii ruutu- ja janakaavio. Epäselvissä tapauksissa voin testata varianssien yhtäsuuruuden SPSS:n varianssianalyysin laskennan yhteydessä. Lue lisää artikkelistani SPSS: Yksisuuntainen varianssianalyysi.

Jos käyttöedellytykset eivät täyty, niin voin käyttää Kruskal-Wallis -testiä.

Parivertailut

Varianssianalyysi kertoo onko ryhmien keskiarvojen välillä merkitseviä eroja. Sen sijaan varianssianalyysi ei kerro minkä ryhmien välillä on merkitseviä eroja. Arvailuja voin tehdä ryhmien keskiarvojen ja kaavion perusteella. Esimerkkini tapauksessa ei ole vaikeaa arvata, että ainakin koulutusohjelmien 1 (keskiarvo 79)  ja 3 (keskiarvo 64,375) välillä on merkitsevä ero. Olisi kuitenkin hyvä tehdä parivertailuja myös muista pareista. Excel ei tarjoa valmiita työkaluja parivertailujen tekemiseen. Kahden riippumattoman otoksen t-testiä ei voi sellaisenaan käyttää, koska testin toistaminen usealle parille lisää hylkäämisvirheen todennäköisyyttä. SPSS sisältää menetelmiä parivertailujen tekemiseen. Lue lisää artikkelistani SPSS: Yksisuuntainen varianssianalyysi.

Toistomittausasetelma

Päivitetty 2.4.2019.

Toistomittausasetelma

Ennen tämän artikkelin lukemista on suotavaa lukea artikkelini Kokeellinen tutkimus.

Toistomittausasetelmaa kutsutaan myös riippuvien otosten asetelmaksi.

Jos tutkin alkoholin vaikutusta reaktioaikaan, niin voin toteuttaa toistomittausasetelman seuraavasti:

  • Valitsen ryhmän koehenkilöitä.
  • Mittaan reaktioajat ilman alkoholia ja samoille henkilöille alkoholin nauttimisen jälkeen.
  • Lasken kullekin koehenkilölle reaktioaikojen eron ja edelleen kaikkien koehenkilöiden erojen keskiarvon. Jos erojen keskiarvo poikkeaa merkitsevästi nollasta, niin voin pitää tätä alkoholin vaikutuksena.

Erojen keskiarvoa voin testata kahden riippuvan otoksen t-testillä.

Klassisen koeasetelman ja toistomittauksen vertailua

Toistomittausasetelmaa käyttäessäni voin käyttää pienempää tutkittavien joukkoa, koska tutkittavia ei tarvitse jakaa koeryhmään ja vertailuryhmään.

Toistomittausasetelmassa henkilöiden välinen reaktioaikojen vaihtelu ei peitä alkoholin vaikutusta samalla tavoin kuin klassisessa koeasetelmassa, koska jokaisen henkilön kohdalla reaktioaikaa (ilman alkoholia) verrataan henkilön itsensä reaktioaikaan (alkoholin vaikutuksen alaisena).

Ensimmäinen reaktioajan mittaus voi aiheuttaa oppimista, joka parantaa toisen mittauksen reaktioaikaa. Ongelman vaikutusta voin lieventää vaihtelemalla satunnaisesti järjestystä (joillekin mittaan ensin reaktioajan ilman alkoholia ja toisille alkoholin vaikutuksen alaisena). Tämä toki lisää odotusaikoja, koska alkoholin vaikutuksen poistumista täytyy odottaa melko kauan.

Klassisen koeasetelman ja toistomittausasetelman paremmuus riippuu tutkittavasta ilmiöstä ja täytyy miettiä tapauskohtaisesti.

Kategorinen muuttuja

Jos mitattava muuttuja on kategorinen, niin keskiarvojen käyttö ei tule kyseeseen. Tällöin en voi testata eron merkitsevyyttä riippuvien otosten t-testillä. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä.

Kokeellinen tutkimus

Päivitetty 2.4.2019.

Kokeellisen tutkimuksen peruskysymys: Onko vaikutusta?

Esimerkki. Onko alkoholilla vaikutusta reaktioaikaan? Tämä selviää kokeilemalla. Voin suunnitella koeasetelman, jossa mittaan reaktioaikoja ilman alkoholia ja alkoholin vaikutuksen alaisena. Tässä on kyse kokeellisesta tutkimuksesta.

Kokeellisessa tutkimuksessa tutkija aktiivisesti muuttaa oletettua vaikutuksen aiheuttajaa (nautittu alkoholi) ja tarkkailee mahdollista vaikutusta (reaktioajan muutos). Kokeellista tutkimusta käytetään nimenomaan syy-vaikutussuhteiden tutkimiseen.

Syy-vaikutus?

Voin perustellusti väittää, että muuttujan x arvojen muutos vaikuttaa muuttujan y arvoihin (syy-vaikutussuhde), jos seuraavat kolme ehtoa täyttyvät:

  1. x:n muutos esiintyy ajallisesti ennen y:n muutosta
  2. x:n muutoksen ja y:n muutoksen välillä on riippuvuutta
  3. x:n muutoksen jälkeen havaittua y:n muutosta ei voida selittää millään muilla tekjöillä.

Yllä lueteltujen kolmen ehdon täyttyminen pyritään kokeellisessa tutkimuksessa varmistamaan seuraavasti:

  • Tutkija muuttaa syyksi arvellun muuttujan x arvoja ja mittaa y:n arvot sen jälkeen. Näin taataan, että x:n muutos esiintyy ajallisesti ennen y:n muutosta.
  • Tutkija selvittää tilastollisia menetelmiä käyttäen onko x:n ja y:n välinen riippuvuus tilastollisesti merkitsevää eli suurempaa kuin satunnaisvaihtelun aiheuttama riippuvuus.
  • Koeasetelma pyritään järjestelemään siten että muiden mahdollisesti y:hyn vaikuttavien tekijöiden vaikutus saadaan kontrolloitua.

Klassinen koeasetelma

Jos tutkin alkoholin vaikutusta reaktioaikaan, niin voin toteuttaa klassisen koeasetelman seuraavasti:

  • Valitsen joukon koehenkilöitä.
  • Jaan koehenkilöt satunnaisesti kahteen ryhmään. Satunnaistamisella pyrin takaamaan ryhmät, jotka ovat muiden reaktioaikaan vaikuttavien tekijöiden osalta samankaltaiset.
  • Ensimmäiselle ryhmälle (vertailuryhmä) mittaan reaktioajat ilman alkoholia.
  • Toiselle ryhmälle (koeryhmä) annan nautittavaksi tietyn määrän alkoholia ja mittaan reaktioajat esimerkiksi tunnin kuluttua alkoholin nauttimisesta.
  • Lasken kummallekin ryhmälle reaktioaikojen keskiarvon. Jos keskiarvojen välillä on merkitsevä ero, niin voin pitää tätä alkoholin vaikutuksena.

Pystynkö osoittamaan edellä kuvatulla koeasetelmalla alkoholin mahdollisen vaikutuksen reaktioaikaan? Tarkastellaan asiaa syy-vaikutussuhteen kolmen ehdon pohjalta:

  1. x:n muutos esiintyy ajallisesti ennen y:n muutosta
  2. x:n muutoksen ja y:n muutoksen välillä on riippuvuutta
  3. x:n muutoksen jälkeen havaittua y:n muutosta ei voida selittää millään muilla tekjöillä.

1. Kuvatussa koeasetelmassa on selvää, että syyksi arvellun muuttujan (alkoholi) muutos tapahtuu ajallisesti ennen vaikutusta (reaktioajan mahdollinen muutos).

2. Alkoholin ja reaktioajan välisen riippuvuuden olemassaolon voin varmistaa vertaamalla koeryhmän ja vertailuryhmän reaktioaikojen keskiarvoja. Käytännössä voin testata koeryhmän ja vertailuryhmän eron merkitsevyyden kahden riippumattoman otoksen t-testillä.

3. Muiden reaktioaikaan mahdollisesti vaikuttavien tekijöiden osalta voin tehdä muiden muassa seuraavia huomioita:

  • Jos reaktioajoissa on runsaasti henkilöiden välistä vaihtelua, niin reaktioaikojen ero vertailuryhmän ja koeryhmän välillä voi peittyä henkilöiden välisen vaihtelun alle. Epäkohdan korjaamiseksi voin vakioida vaihtelua mahdollisesti aiheuttavia tekijöitä. Voin esimerkiksi valita koehenkilöiksi vain 30-35 vuotiaita miehiä.
  • Jos reaktioaika ilman alkoholia mitataan heti ja alkoholia nauttineiden vasta tunnin päästä, niin odottelun aiheuttama väsyminen voi vaikuttaa reaktioaikaan. Tämä epäkohta voidaan korjata laittamalla myös alkoholia nauttimattomat odottamaan tunti ennen reaktioajan mittaamista.
  • Jos nesteen nauttiminen vaikuttaa reaktioaikaan, niin mahdollisesti havaittava ero ei välttämättä johdukaan alkoholista. Tämä epäkohta voidaan korjata juottamalla vertailuryhmälle esimerkiksi mehua.
  • Jos alkoholia nauttineilla on ennakkokäsitys alkoholin vaikutuksesta reaktioaikaan, niin he voivat aiheuttaa muutoksen reaktioaikaan omalla asenteellaan. Tämä epäkohta korjaantuisi, jos kyseessä olisi sokkokoe (henkilöt eivät tietäisi kumpaan ryhmään kuuluvat). Käytännössä sokkokoe ei tässä onnistu, koska alkoholia nauttineet luultavasti havaitsevat nauttineensa alkoholia.
  • Jos reaktioajan mittaus perustuu yhteen mittaukseen, niin satunnaisista syistä johtuen joillekin henkilöille saattaa tulla huono reaktioaika (keskittymisen herpaantuminen). Mittaustapahtumaan kannattaa siis kiinnittää erityistä huomiota. Mittauksen voisi toistaa useita kertoja ja eri kerroista voisi laskea keskiarvon.

Yllä kerrotun perusteella muiden mahdollisesti vaikuttavien tekijöiden kontrollointi vaatii paljon ajattelua ja vaivaa. Mitä paremmin muut havaittua vaikutusta selittävät tekijät saadaan kontrolloitua sitä korkeampi on koeasetelman sisäinen validiteetti.

Klassinen koeasetelma etukäteismittauksella

Voin liittää koeasetelmaan myös etukäteismittauksen. Tällöin voin varmistua siitä, että koeryhmä ja vertailuryhmä ovat lähtötilanteessa samankaltaiset. Niidenhän pitäisi olla samankaltaiset, koska kohdejoukko on jaettu satunnaisesti koeryhmään ja vertailuryhmään.

Riippuu tutkittavasta asiasta, onko etukäteismittaus paikallaan. Jos esimerkiksi vertaan kahden erilaisen mainoskirjeen vaikutusta vastaanottajien keskiarvotilaukseen, niin etukäteismittaus ei ole edes mahdollinen. Jos taas tutkin verenpainelääkkeen tehoa, niin mittaan kohdejoukon verenpaineet ennen lääkityksen aloittamista. Kun tutkin alkoholin vaikutusta reaktioaikaan, niin etukäteismittaus on mahdollinen.

Esimerkki. Voin mitata kaikilta koehenkilöiltä reaktioajan. Tämä jälkeen vertailuryhmä juo mehua ja koeryhmä juo alkoholia. Esimerkiksi tunnin kuluttua juomisesta mittaan reaktioajat uudelleen. Kullekin henkilölle lasken reaktioajan muutoksen ensimmäisestä mittauksesta toiseen mittaukseen. Kummallekin ryhmälle lasken reaktioaikojen muutosten keskiarvon. Näiden keskiarvojen eroa voin testata kahden riippumattoman otoksen t-testillä.

Sisäinen ja ulkoinen validiteetti

Mainitsin jo aiemmin sisäisen validiteetin. Sillä tarkoitetaan koeasetelman pätevyyttä syy-vaikutussuhteen osoittamiseen. Mitä paremmin pystyn kontrolloimaan muut mahdollisesti vaikutusta aiheuttavat tekijät, sitä korkeampi on tutkimuksen sisäinen validiteetti.

Ulkoinen validiteetti liittyy tulosten yleistämiseen toiseen paikkaan, toiseen kohdejoukkoon, toiseen ajankohtaan jne. Ulkoinen validiteetti on sitä parempi, mitä paremmin voin yleistää tulokset koeasetelman ulkopuolelle.

Kategorinen muuttuja

Jos mitattava muuttuja on kategorinen, niin keskiarvojen käyttö ei tule kyseeseen. Tällöin en voi testata eron merkitsevyyttä riippumattomien otosten t-testillä. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä.

Toistomittaus

Vaihtoehto edellä kuvatulle asetelmalle on toistomittausasetelma, jossa tutkittavia ei erotella koeryhmään ja vertailuryhmään, vaan mitataan samoille henkilöille reaktioajat ilman alkoholia ja alkoholia nauttineina. Voit lukea lisää artikkelistani Toistomittausasetelma.

Useita ryhmiä

Edellä käsittelin koeasetelmaa, jossa on vertailuryhmä ja koeryhmä. Vertailuryhmään ei kohdisteta mitään käsittelyä tai lumekäsittely. Jos koeastelmassa halutaan tarkastella useita erilaisia käsittelyitä, niin ryhmiä on useampia kuin 2.

Esimerkki. Voin mitata reaktioaikoja kolmelle toisistaan riippumattomalle ryhmälle: ilman alkoholia, kahden alkoholiannoksen jälkeen ja neljän alkoholiannoksen jälkeen. Tällöin käytän reaktioaikojen keskiarvojen erojen testaamiseen yksisuuntaista varianssianalyysiä.

Excelin väriasteikot

Päivitetty 1.2.2019.

Voin havainnollistaa taulukon lukuja värjäämällä solut lukuarvosta riippuvalla värillä:

  • Valitsen solut, joiden sisältämiä lukuja haluan havainnollistaa.
  • Valitsen Home (Aloitus) -välilehdeltä Conditional Formatting – Color Scales (Ehdollinen muotoilu – Väriasteikot) ja valitsen haluamani väriasteikon. Valittavana on kaksivärisiä (2-Color Scale) ja kolmivärisiä (3-Color Scale) asteikoita.

Esimerkiksi seuraavassa havainnollista 5-portaisen mielipideasteikon tyytyväisyyskeskiarvoja kolmivärisellä asteikolla. Keskikohtaa (3) pienemmät arvot ovat sitä punaisempia mitä kauempana ne ovat keskikohdasta. Keskikohta (3) on valkoinen. Keskikohtaa (3) suuremmat arvot ovat sitä sinisempiä mitä kauempana ne ovat keskikohdasta.

Voin vaihtaa väriasteikon ominaisuuksia:

  • Valitsen väriasteikolla varusteutut solut (yhden solun valitseminenkin riittää).
  • Valitsen Home (Aloitus) -välilehdeltä Conditional Formatting – Manage Rules (Ehdollinen muotoilu – Hallitse sääntöjä).
  • Napsautan Edit Rule (Muokkaa sääntöä) -painiketta. Jos samoihin soluihin kohdistuu useampia ehdollisen muotoilun sääntöjä, niin ennen Edit Rule -painikkeen napsauttamista napsautan sääntöä, jota haluan muuttaa.

Seuraavassa olen määrittänyt kolmivärisen asteikon, jossa pienin arvo 1 on punainen, arvo 3 on valkoinen ja suurin arvo 5 on sininen.

Pääsen eroon väriasteikosta valitsemalla Home (Aloitus) -välilehdeltä Conditional Formatting – Clear Rules (Ehdollinen muotoilu – Poista säännöt). Voin valita, poistanko valittujen solujen säännöt vai koko laskentataulukon säännöt.

Huomaathan, että mustavalkotulostukseen tarkoitetuissa esityksissä ei pidä käyttää väriasteikkoa.

Excelin tietopalkit

Päivitetty 2.2.2019.

Voin havainnollistaa taulukon lukuja lisäämällä tietopalkit suoraan lukuja sisältäviin soluihin:

  • Valitsen solut, joiden sisältämiä lukuja haluan havainnollistaa.
  • Valitsen Home (Aloitus) -välilehdeltä Conditional Formatting – Data Bars (Ehdollinen muotoilu – Tietopalkit) ja valitsen haluamani värin.

Palkkien pituus määräytyy siten että suurimman luvun omaavan solun tietopalkki on koko solun mittainen (vasemmanpuoleisimmat palkit seuraavassa kuvassa).

Voin vaihtaa palkkien ominaisuuksia:

  • Valitsen solut, joissa palkit ovat (yhden solun valitseminenkin riittää).
  • Valitsen Home (Aloitus) -välilehdeltä Conditional Formatting – Manage Rules (Ehdollinen muotoilu – Hallitse sääntöjä).
  • Napsautan Edit Rule (Muokkaa sääntöä) -painiketta. Jos samoihin soluihin kohdistuu useampia ehdollisen muotoilun sääntöjä, niin ennen Edit Rule -painikkeen napsauttamista napsautan sääntöä, jota haluan muuttaa.

Seuraavassa olen muuttanut palkkien minimiä (1) ja maksimia (5). Edellisen kuvan keskimmäisissä palkeissa näet muutoksen vaikutuksen. Voisin myös valita näytettäväksi pelkästään palkit (Show Bar Only) kuten edellisen kuvan oikeanpuoleisimmissa palkeissa.

Vaihtamalla palkkien suuntaa (Bar Direction) voin toteuttaa esimerkiksi seuraavan kuvan palkit (olen vaihtanut miesten palkkien suunnan).

Pääsen eroon palkeista valitsemalla Home (Aloitus) -välilehdeltä Conditional Formatting – Clear Rules (Ehdollinen muotoilu – Poista säännöt). Voin valita, poistanko valittujen solujen säännöt vai koko laskentataulukon säännöt.

Graafinen esittäminen

Päivitetty 1.2.2019

Monissa tapauksissa voin havainnollistaa numerotaulukon sisältöä graafisesti. Pidän kuitenkin mielessä kohderyhmän. Numeroihin tottuneelle ja tarkkaa tietoa kaipaavalle kohderyhmälle esitän mieluummin numeroita sisältävän taulukon. Nopeaa yhteenvetoa kaipaavalle ja/tai numeroihin tottumattomalle kohderyhmälle havainnollistan numerotaulukon graafisesti.

Pidän kaaviota laatiessa mielessäni, että laadin kaavion jollekin toiselle, en itselleni. Yritän asettua kaavion katsojan asemaan ja huomioin seuraavat seikat:

  • Kaaviolla tulee olla tarkoitus ja tehtävä: minkä tiedon/viestin haluan välittää katsojalle?
  • Kaaviolla tulee olla kohderyhmä: kenelle kaavio on tarkoitettu?
  • Kokeilen eri vaihtoehtoja ja valitsen tarkoitukseen ja kohderyhmälle parhaiten sopivan esitystavan.
  • Kaavion tulee olla selkeä ja helposti ymmärrettävä.
  • Johdatan katsojan huomion esitettävään tietoon/viestiin, en kaavion tehosteisiin.
  • Esitän tiedot peittelemättä ja rehellisesti.
  • Otsikoin akselit ja esitän käytetyt yksiköt selkeästi.
  • Ilmoitan tiedon lähteen, jos tieto on peräisin ulkopuolisesta lähteestä.
  • Lisään tarvittaessa kaavioon huomautuksia korostaakseni epätavallisten tai poikkeavien arvojen syitä.
  • Yhdistän kaavion luontevasti sitä edeltävään tai seuraavaan sanalliseen selitykseen, jossa kerron mihin seikkoihin katsojan kannattaa kaaviossa kiinnittää huomioita. Huomion arvoisia seikkoja ovat yleensä erot, riippuvuudet, poikkeukset tai kehityssuunnat.

Arvosarjat

Kaaviossa esitän yhden tai useampia arvosarjoja (data series). Arvosarjat voivat ilmetä kaaviossa esimerkiksi seuraavilla tavoilla:

  • Jos esitän yhden arvosarjan pylväskaaviona, niin kaaviossa on vain yhden värisiä pylväitä. Yksi pylväs vastaa aina yhtä arvosarjan arvoa.
  • Jos esitän pylväskaaviossa useamman arvosarjan, niin jokaista arvosarjaa vastaavat oman värisensä pylväät.
  • Jos esitän viivakaaviossa yhden arvosarjan, niin kaaviossa on yksi viiva.
  • Jos esitän viivakaaviossa useamman arvosarjan, niin kaaviossa on yksi viiva jokaiselle arvosarjalle.
  • Piirakkakaaviossa piirakan siivut vastaavat arvosarjan arvoja.
  • Hajontakaaviossa on kaksi yhtä monta arvoa sisältävää arvosarjaa. Ensimmäisen sarjan arvoakselina on vaaka-akseli ja toisen sarjan arvoakselina pystyakseli. Arvosarjojen arvot muodostavat pareja. Jokaista paria vastaa hajontakaavion piste.

Onnistuneen kaavion laatimiseksi arvosarjan arvojen täytyy olla Excel-taulukossa allekkain tai vierekkäin. Taulukkoon kannattaa lisätä otsikot:

  • Koko arvosarjan otsikko (nimi) välittömästi arvosarjan yläpuolelle (jos arvosarjan arvot allekkain) tai vasemmalle puolelle (jos arvosarjan arvot vierekkäin).
  • Jos arvosarjan yksittäisillä arvoilla on otsikot, niin ne kannattaa sijoittaa taulukkoon arvosarjan vasemmalle puolelle (jos arvosarjan arvot allekkain) tai yläpuolelle (jos arvosarjan arvot vierekkäin).

arvosarja1

Yllä näkyvän taulukon kaksi arvosarjaa ovat 17, 15, 6 ja 8, 15, 21. Arvosarjojen nimet ovat Mies ja Nainen. Arvosarjojen yksittäisten arvojen otsikot ovat Tyytymätön, Ei tyytymätön eikä tyytyväinen ja Tyytyväinen. Taulukon arvosarjat voin esittää kaaviona esimerkiksi seuraavasti:

arvosarja2

Arvosarjat erottuvat toisistaan eri värisinä ja värit selitetään selitteessä (Legend). Yksittäisten arvojen nimet näkyvät luokka-akselilla (Category axis) ja arvojen suuruus arvoakselilla (Value axis).

Opit kaavioiden laatimiseen liittyvät keskeiset taidot käymällä läpi itseopiskelupaketin kaavio.xlsx ohjein varustetut esimerkit.

Kaaviolajeja

Excelissä on tarjolla monia kaaviolajeja. Suosin useimmille tuttuja kaaviolajeja: vaakapylväskaavio, pystypylväskaavio, viivakaavio ja hajontakaavio.

Vaakapylväskaavio

Excelissä vaakapylväskaaviota kutsutaan palkkikaavioksi (Bar). Vaakapylväskaavio sopii lukumäärien, rahamäärien, prosenttien ja keskiarvojen esittämiseen.

Pystypylväskaavio

Pystypylväskaavio (Column) sopii samankaltaisiin tilanteisiin kuin vaakapylväskaaviokin. Jos pylväät esittävät määrällisen muuttujan luokkia, esimerkiksi palkkaluokkia, niin pylväät laitetaan kiinni toisiinsa.

arvosarjat3

Viivakaavio

Viivakaavio (Line) on havainnollisin tapa esittää ajallista kehitystä. Esimerkiksi kuukausimyynnit 12 kuukauden ajalta tai bensiinin hinta päivittäin viimeisen kuukauden ajalta kannattaa esittää viivakaaviona. Yksityiskohtaista tietoa ja hyviä niksejä aikasarjojen esittämiseen löydät itseopiskelupaketista aikasarjat.xlsx.

Hajontakaavio

Excelissä hajontakaaviota kutsutaan pistekaavioksi (Scatter). Hajontakaaviosta käytetään myös nimitystä sirontakaavio. Hajontakaavion taustalla on kaksi samanmittaista arvosarjaa, joiden arvot muodostavat pareja. Hajontakaavion avulla nähdään, onko kahden arvosarjan välillä riippuvuutta. Esimerkiksi seuraavasta hajontakaaviosta näen, onko opiskelijan kurssin aikana tekemien harjoitusten lukumäärän ja tenttipisteidän välillä riippuvuutta?

arvosarja4

Piirakkakaavio

Excelissä piirakkakaaviota kutsutaan ympyräkaavioksi (Pie). Piirakkakaaviolla voin havainnollistaa kokonaisuuden jakaantumista osiin. Piirakkakaaviota käytettäessä kaikkien kokonaisuuden osien täytyy olla mukana: Jos esimerkiksi esitän älypuhelintyyppien (Android, iPhone, Windows Phone) markkinaosuuksia piirakkana, niin mukana täytyy olla myös siivu edustamassa muita puhelintyyppejä.

Piirakkakaavion käyttöä kohtaan voidaan esittää kritiikkiä. Lue lisää artikkelista Paha piirakkakaavio.

Harvinaisempia kaavioita

Haluaisitko laatia Excelillä pyramidikaavion, mielipideprofiilin, Ganttin kaavion tai funktion kuvaajan. Onnistuu: kaavio2.xlsx.

SPSS: Explore

Päivitetty 25.9.2020

Keskiarvoja koskevassa testauksessa oletetaan, että otoskeskiarvot ovat normaalijakautuneet. Jos otoskoko on vähintään 30, niin asiaa ei tarvitse erikseen testata. Pienillä otoksilla normaalijakautuneisuus kannattaa testata SPSS:n Exlore-toiminnolla. Itse asiassa tällöin testataan muuttujan normaalijakautuneisuus, joka takaa myös otoskeskiarvojen normaalijakautuneisuuden pienilläkin otoksilla. Explore-toiminto on muutenkin hyödyllinen määrällisen muuttujan tarkastelussa, koska samalla saadaan keskiarvon luottamusväli, histogrammi ja ruutu- ja janakaavio (boxplot).

Seuraavassa käytän esimerkkinä valmiiksi SPSS-muotoista dataa reaktioajat.sav.

  • Valitsen Analyze – Descriptive Statistics – Explore
  • Siirrän ryhmittelevät muuttujat Factor List -ruutuun (esimerkissäni Alkoholi).
  • Siirrän muuttujat, joita haluan tarkastella Dependent List -ruutuun (esimerkissäni Reaktioaika)
  • Napsautan Plots-painiketta
  • Valitsen oletusvalintojen lisäksi Histogram ja Normality plots with tests
  • Pääsen pois Plots-ikkunasta Continue-painikkeella
  • Valitsen OK.

Tuloksena saat muiden muassa Descriptives-taulukon, johon on laskettu keskeisiä tunnuslukuja sekä keskiarvon luottamusväli (95 % Confidence Interval for Mean). Descriptives-taulukon alapuolella on Tests of Normality -taulukko.

Kolmogorov-Smirnov -testi ja Shapiro-Wilk -testi testaavat normaalijakautuneisuutta. Nollahypoteesina on molemmissa ”Muuttuja noudattaa normaalijakaumaa”. Testien p-arvot löytyvät taulukon Sig. -sarakkeista. Molempien ryhmien (Ei-alkoholia ja Alkoholia) kohdalla nollahypoteesi jää voimaan, koska p-arvot ovat suurempia kuin 0,05. Jos Kolmogorov-Smirnov -testi ja Shapiro-Wilk -testi johtavat erilaisiin päätelmiin, niin minä olisin taipuvainen käyttämään testejä, joissa ei tarvitse olettaa normaalijakautuneisuutta.

SPSS tulostaa muuttujan jakaumia esittävät histogrammit sekä useita normaalijakautuneisuuden arviointiin tarkoitettuja kuvioita. Erityisen havainnollinen on ruutu- ja janakaavio (boxplot).

Ruutu- ja janakaavion ruudun alareuna vastaa alaneljännestä ja yläreuna yläneljännestä. Ruudun sisällä oleva vaakaviiva vastaa mediaania. Janojen päissä olevat vaakaviivat kuvaavat pienintä ja suurinta arvoa. Jos muuttujalla on arvoja, jotka sijaitsevat yli 1,5 ruudun korkeuden verran ruudun yläpuolella tai alapuolella, niin ne esitetään omina pisteinään (tällöin janojen päissä olevat vaakaviivat eivät tietenkään kuvaa pienintä ja suurinta arvoa). Yli 1,5 ruudun korkeuden verran ruudun yläpuolella tai alapuolella olevia havaintoja kutsutaan poikkeaviksi (outlier). Poikkeavien havaintojen vieressä on havainnon rivinumero datassa.

SPSS: Kahden riippuvan otoksen vertailu

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippuvan otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippuvan otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon (samaan tulokseen päädyn, jos lasken reaktioaikojen keskiarvojen eron).

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Riippuvia otoksia voidaan kutsua myös parittaisiksi otoksiksi. Käytettyä tutkimusasetelmaa voidaan kutsua toistomittaukseksi (mittaukset toistetaan samoille henkilöille).

Mitä enemmän erojen keskiarvo poikkeaa nollasta sitä enemmän minulla on perusteita väittää, että alkoholia nauttineilla on eri suuruinen reaktioaika. Pieni poikkeama nollasta voi kuitenkin selittyä otantavirheellä. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö erojen keskiarvon poikkeama nollasta pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippuvan otoksen t-testin (myös nimitystä parittaisten otosten t-testi käytetään). T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että erojen keskiarvon poikkeama nollasta selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Testin suorittamiseksi minun täytyy valita suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna ei ole käsitystä siitä onko erojen keskiarvo positiivinen vai negatiivinen, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain tietyn merkkinen erojen keskiarvo tulee kyseeseen tai olen yksinomaan kiinnostunut tietyn merkkisestä erosta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa pienempi poikkeama riittää tilastollisesti merkitsevään testitulokseen.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä. Tällöin myös mittausten erojen keskiarvon laskeminen on mielekästä.

Jos otoskoko on vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että erot ovat likimain normaalisti jakautuneet. Jos mitattavat muuttujat voidaan olettaa normaalijakautuneiksi, niin sitä suuremmalla syyllä myös mittausten ero voidaan olettaa normaalijakautuneeksi. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa).  Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Seuraavassa käytän esimerkkinä dataa reaktioajatriippuvat.sav, joka on valmiiksi SPSS-muotoinen data. Kahden riippuvan otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Paired-Samples T Test
  • Valitsen vertailtavan parin (ensimmäisen muuttujan valitsen normaalisti ja toisen ctrl-näppäin alhaalla. Siirrän valitun parin Paired Variables -ruutuun. Toistan menettelyn jos haluan vertailla useampia muuttujapareja.
  • OK.

Tulosteina saan taulukon, jossa on molepien ryhmien keskiarvot, otoskoot ja keskihajonnat. Toisessa taulukossa on muuttujien välinen korrelaatiokerroin. Odotettavissa on yleensä iso korrelaatiokerroin, koska muuttujien arvot vastaavat pareittain toisiaan. Esimerkissämme korrelaatiokerroin 0,885 on tilastollisesti merkitsevä (p < 0,001).

Varsinaisesta parittaisen t-testin taulukosta löydän muiden muassa parien erojen keskiarvon (0,1702) ja keskeiset testin tunnusluvut: t eli testimuuttujan arvo, df eli vapausasteiden lukumäärä ja Sig. (2-tailed) eli p-arvo. Testin tuloksen voin raportoida esimerkiksi seuraavasti:

Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025, n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023, n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,630, p < 0,001, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,630.

Huomaa, että taulukossa on myös erojen keskiarvon luottamusvälin alaraja ja yläraja. Esimerkkitapauksessa erojen keskiarvon 95 % luottamusväli on 0,01054 – 0,02350.

Mihin kahden riippuvan otoksen t-testin laskenta perustuu?

Vaikka testissä tarkastellaan kahta otosta, niin viime kädessä kyseessä on yhden keskiarvon testaaminen (erojen keskiarvo). Jos haluat tietää enemmän niin lue lisätietoa.

Muita menetelmiä kahden riippuvan otoksen vertailuun

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: Kahden riippumattoman otoksen vertailu

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippumattoman otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippumattoman otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Mitä enemmän otosten keskiarvot poikkeavat toisistaan sitä enemmän minulla on perusteita väittää, että alkoholi vaikuttaa miesten reaktioaikaan. Pienet erot keskiarvoissa voivat selittyä otantavirheellä. Reaktioajoissa on luontaista vaihtelua miesten välillä ja on sattuman varassa minkälaisen reaktioajan omaavat miehet otoksiin satutaan valitsemaan. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö keskiarvojen ero pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippumattoman otoksen t-testin. T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että keskiarvojen ero selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Testin suorittamiseksi minun täytyy valita suoritanko yhtäsuurten vai erisuurten varianssien testin sekä suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Yhtäsuurten vai erisuurten varianssien testi?

Kahden riippumattoman otoksen t-testistä on kaksi versiota. Yhtäsuurten varianssien testi sopii tilanteisiin, joissa verrattavien ryhmien varianssit (varianssi on keskihajonnan toinen potenssi) ovat likimain yhtäsuuret. Erisuurten varianssien testiä taas voidaan käyttää tilanteisiin, joissa verrattavien ryhmien varianssien yhtäsuuruutta ei voida olettaa.

Kysymys: Mistä tiedän pitääkö käyttää yhtäsuurten vai erisuurten varianssien testiä?

Vastaus: Jos lasket testin SPSS:llä, niin SPSS laskee myös Levene-testin, jonka perusteella voit tehdä valinnan (selitän tarkemmin myöhemmin).

Jos haluat perehtyä tarkemmin yhtäsuurten ja erisuurten varianssien testien eroihin, niin lue lisätietoa.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna kumman tahansa ryhmän keskiarvo voi olla toista suurempi, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain toisen ryhmän keskiarvo voi olla suurempi tai olen yksinomaan kiinnostunut toisen ryhmän keskiarvon suuremmuudesta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa keskiarvojen tilastollisesti merkitsevä ero saavutetaan pienemmällä keskiarvojen erolla.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä.

Jos otoskoot ovat vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että tarkasteltava muuttuja on perusjoukossaan likimain normaalisti jakautunut. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa). Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Seuraavassa käytän esimerkkinä dataa reaktioajat.sav, joka on valmiiksi SPSS-muotoinen data. Kahden riippumattoman otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Independent-Samples T Test
  • Siirrän muuttujan, jonka keskiarvoista olen kiinnostunut, Test Variable(s) -ruutuun
  • Siirrän ryhmittelevän muuttujan Grouping Variable -ruutuun (esimerkissäni alkoholi)
  • Määrittelen vertailtavat ryhmät Define Groups -painikkeella. Esimerkissäni kirjoitan 0 Group 1 -ruutuun ja 1 Group 2-ruutuun (alkoholi-muuttujan arvot ovat 0 ja 1)
  • Define Groups -ikkunasta pääsen pois Continue-painikkeella
  • Valitsen OK.

SPSS tulostaa luonnollisesti molempien ryhmien otoskoot, keskiarvot ja keskihajonnat.

Varsinaisessa testitaulukossa on ensimmäisenä Levene-testi:

Jos Levene-testin Sig. (p-arvo) on vähintään 0,050, niin voin käyttää yhtäsuurten varianssien testiä. Jos Levene-testin Sig. (p-arvo) on pienempi kuin 0,050, niin käytän eri suurten varianssien testiä. Esimerkissäni käytän yhtäsuurten varianssien testiä (Levene-testin p = 0,114).

Koska päädyin yhtä suurten varianssien testiin, niin luen riviä Equal variances assumed. Sig. (2-tailed) -sarakkeesta löydän kaksisuuntaisen testin p-arvon 0,005. Tuloksen voin raportoida esimerkiksi seuraavasti:

Alkoholia nauttineiden reaktioaikojen keskiarvo 0,237 sekuntia (keskihajonta = 0,035, n=15) poikkesi raittiiden reaktioaikojen keskiarvosta 0,205 sekuntia (keskihajonta = 0,020, n=15). Ero osoittautui riippumattomien otosten t-testillä merkitseväksi: t(28) = -3,046, p = 0,005, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(28) = -3,046.

Huomaa, että tulostaulukon oikeasta reunasta löydät keskiarvojen erotuksen luottamusvälin alarajan ja ylärajan. Esimerkin tapauksessa luen luottamusvälin alarajan ja ylärajan taulukon ylemmältä riviltä, koska päädyin käyttämään yhtä suurten varianssien testiä.

spsst3

Keskiarvojen erotuksen 95 % luottamusväli on 0,01015 – 0,01040.

Muita menetelmiä kahden riippumattoman otoksen vertailuun

Kahden riippumattoman otoksen t-testi soveltuu kokeelliseen tutkimusasetelmaan, jossa vertaillaan kahta riippumatonta otosta (kuten tämän artikkelin reaktioaika-esimerkki). Testiä voidaan käyttää myös ei-kokeellisissa tutkimusasetelmissa. Esimerkiksi kyselytutkimusainestossa voidaan verrata eläkeläisten ja työssäkäyvien TV:n katseluun käytettyä aikaa.

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: khiin neliö -testi

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa khiin neliö -testin myös Excelillä. Lue lisää artikkelistani Ristiintaulukointi ja khiin neliö -testi.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Tärkeä huomautus: Tässä artikkelissa esitettävä khiin neliö -testi soveltuu käytettäväksi kahden kategorisen muuttujan tapauksessa. Jos toinen muuttujista on mielipideasteikollinen, niin Mann-Whitney U -testi (kahden ryhmän vertailu) tai Kruskal-Wallis -testi (useamman ryhmän vertailu) ovat suositeltavampia testimenetelmiä.

Jos ristiintaulukoin kaksi kategorista muuttujaa, niin tarkastelen joko muuttujien välistä riippuvuutta tai vertailen ryhmiä. On jokseenkin samantekevää puhunko riippuvuudesta vai ryhmien eroista. Kokeellisessa tutkimuksessa kuitenkin puhun mieluummin ryhmien vertailusta ja ei-kokeellisessa tutkimuksessa (esimerkiksi kyselytutkimus) riippuvuudesta. Khiin neliö -testillä testaan onko riippuvuus tai ryhmien välinen ero tilastollisesti merkitsevä.

SPSS ja khiin neliö -testi

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Käytän seuraavassa esimerkkidataa PopularKids.sav, joka on valmiiksi SPSS-muotoinen. Datan kuvaus https://asta.math.aau.dk/datasets/?file=PopularKids.html

Ristiintaulukoinnin ja khiin neliö -testin voin suorittaa seuraavasti:

  • Valitsen Analyze – Descriptive Statistics – Crosstabs
  • Siirrän rivi ja sarakemuuttujat paikoilleen
  • Jos haluan prosentteja, niin valitsen ne Cells -painikkeen takaa
  • Valitsen Statistics-painikkeen takaa Chi-square.

Jos lasken ristiintaulukoinnin sukupuolen (Gender) ja tavoitteen (Goals) välille, niin saan seuraavat tulosteet:

Ristiintaulukoinnista näen, että tyttöjen kohdalla on suhteessa enemmän niitä, joiden ensisijaisena tavoitteena on olla suosittu. Pojissa taas on suhteessa enenmmän niitä, joiden ensisijaisena tavoitteena on olla hyvä urheilussa. Jälkimmäisestä taulukosta luen p-arvon Asymp Sig. (2-sided) -sarakkeesta ja Pearson Chi-Square -riviltä. Tässä tapauksessa p-arvo on kolmella desimaalilla 0,000, joten sukupuolen ja tavoitteen välillä on tilastollisesti merkitsevä riippuvuus. Tuloksen voin raportoida esimerkiksi seuraavasti:

Khiin neliö -testin mukaan sukupuolen ja tavoitteen välillä on merkitsevä riippuvuus (χ2 (2) = 21,455; p < 0,001).

Edellä vapausasteluku df=2 on suluissa khiin neliö merkin χ2 perässä.

Tarkastelen vielä toisena esimerkkinä ihonvärin (Race) ja tavoitteen (Goals) välistä riippuvuutta.

Testin tuloksen voin raportoia esimerkiksi seuraavasti: Khiin neliö -testin mukaan ihonvärin ja tavoitteen välillä ei ole merkitsevää riippuvuutta (χ2 (2)  = 1,443; p = 0,486).

Testin käyttöedellytykset

On tärkeää, että tarkastan testin käyttöedellytykset testitaulukon alapuolelta. Käyttöedellytykset liittyvät niin kutsuttuihin odotettuihin lukumääriin (expected counts). Jos haluat tietää, mitä odotetulla lukumäärällä tarkoitetaan, niin lue artikkelini Ristiintaulukointi ja khiin neliö -testi. Kirjallisuudessa annetaan hieman toisistaan poikkeavia rajoja sille, milloin testaaminen muuttuu epäluotettavaksi. Monissa lähteissä esitetään seuraavat kriteerit testaamisen luotettavuudelle:

  • Taulukossa, jossa on kaksi riviä ja kaksi saraketta (2×2 taulukko) ei saa olla yhtään alle viiden (5) suuruista odotettua frekvenssiä.
  • Suuremmissa taulukoissa alle viiden (5) suuruisia odotettuja frekvenssejä saa olla viidesosa (20 %) kaikista odotetuista frekvensseistä. Alle yhden (1) suuruisia odotettuja frekvenssejä ei saa olla lainkaan.

Edellä kuvatuissa esimerkeissä käyttöedellytykset täyttyvät. Sen sijaan seuraavan testitaulukon kohdalla käyttöedellytykset eivät täyty, koska 27,8 % soluista sisältää liian pienen odotetun lukumäärän (alle 5).

Jos testin käyttöedellytykset eivät täyty, niin testaaminen voi silti olla mahdollista:

  • Jos voin luontevasti yhdistellä kategorioita, niin odotetut lukumäärät kasvavat ja testaaminen saattaa olla mahdollista.
  • Jos käytössäni on Exact Tests -lisäosa, niin voin laskea tarkan p-arvon. Tällöin minun ei tarvitse välittää odotettujen lukumäärien suuruuksista. Jos Exact Tests -lisäosa on käytössä, niin ristiintaulukoinnin määrittelyikkunassa on Exact-painike, jonka alta voin määritellä laskettavaksi Exact-testin. Tällöin luen p-arvon testitaulukon Exact Sig. (2-Sided) -sarakkeesta.

Onko ryhmien välinen ero tilastollisesti merkitsevä?

Päivitetty 25.10.2013.

Ryhmien vertailu on usein määrällisen tutkimuksen keskeisin tehtävä. Esimerkiksi kyselytutkimusaineiston perusteella haluan kenties verrata miehiä ja naisia, eri ikäryhmiä, erilaisen koulutuksen saaneita jne. Kokeellisessa tutkimuksessa taas vertailen koeryhmää ja vertailuryhmää tai erilaisen käsittelyn saaneita.

Jos kyseessä on laajemmasta perusjoukosta poimittu otos, niin ryhmien välillä havaitut erot eivät välttämättä tarkoita todellisia eroja perusjoukossa. Kysehän voi olla pelkästään otantavirheen aiheuttamista eroista. Tämän vuoksi tarvitsen tilastollisia testejä, joiden avulla selviää, ovatko erot tilastollisesti merkitseviä. Asianmukaisen testimenetelmän valitsemiseksi minun täytyy alkajaisiksi tietää kaksi asiaa:

  • Onko kyse toisistaan riippumattomista vai riippuvista ryhmistä? Jos et ymmärrä riippumattoman ja riippuvan eroa, niin lue artikkelini Riippumattomat vai riippuvat otokset?.
  • Onko kyse kategorisesta, mielipideasteikollisesta vai määrällisestä muuttujasta?

Riippumattomat otokset – kategorinen muuttuja

Kategorisen muuttujan ristiintaulukoin ryhmittelevän muuttujan kanssa. Testimenetelmänä käytän khiin neliö -testiä.

Riippumattomat otokset – mielipideasteikollinen muuttuja

Mielipideasteikollisen muuttujan ristiintaulukoin ryhmittelevän muuttujan kanssa. Testimenetelmänä käytän khiin neliö -testiä. Jos otoskoko on pieni, niin khiin neliö -testin käyttöedellytykset eivät välttämättä täyty. Tällöin voin yhdistää mielipideasteikon arvoja. Esimerkiksi 5-portaisesta asteikosta ”täysin eri mieltä, jokseenkin eri mieltä, ei eri eikä samaa mieltä, jokseenkin samaa mieltä, täysin samaa mieltä” voin tehdä 3-portaisen asteikon ”eri mieltä, ei eri eikä samaa mieltä, samaa mieltä”.

Monien mielestä parempi vaihtoehto testaamiseen on Mann-Whitney U -testi kahden ryhmän vertailuun tai Kruskal-Wallis -testi useamman ryhmän vertailuun. Nämä soveltuvat myös pienille otoksille. Jos käytän Mann-Whitney U -testiä tai Kruskal-Wallis -testiä, niin lasken silti ristiintaulukoinnin erojen havainnollistamiseksi.

Jos lasken mielipideasteikolle keskiarvoja, niin voin käyttää kahden riippumattoman otoksen t-testiä tai useamman ryhmän vertailuun yksisuuntaista varianssianalyysiä. Monien mielestä keskiarvojen käyttö mielipideasteikoiden kohdalla on kyseenalaista. Lue lisää artikkelistani Mielipideasteikon keskiarvo.

Riippumattomat otokset – määrällinen muuttuja

Määrälliselle muuttujalle lasken keskiarvot. Testimenetelmänä voin käyttää kahden riippumattoman otoksen t-testiä tai useamman ryhmän vertailuun yksisuuntaista varianssianalyysiä.

Erityisesti pienten otosten (n<30) kohdalla t-testin käyttäedellytykset eivät välttämättä täyty. Tällöin voin käyttää Mann-Whitney U -testiä kahden ryhmän vertailuun tai Kruskal-Wallis -testiä useamman ryhmän vertailuun.

Riippuvat otokset – kategorinen muuttuja

Jos tarkasteltavat muuttujat ovat kaksiarvoisia eli dikotomisia, niin testimenetelmäksi sopii McNemar-testi. Voin esimerkiksi testata muuttuuko henkilöiden aikomus ostaa tuottetta promootion seurauksena. Tällöin muuttujina ovat ostohalukkuus ennen promootiota (kyllä/ei) ja samojen henkilöiden ostohalukkuus promootion jälkeen.

Riippuvat otokset – mielipideasteikollinen muuttuja

Voin käyttää Wilcoxon merkittyjen sijalukujen testiä kahden ryhmän vertailuun tai Friedman-testiä useamman ryhmän vertailuun.

Jos lasken mielipideasteikolle keskiarvoja, niin voin käyttää kahden riippuvan otoksen t-testiä tai useamman ryhmän vertailuun toistomittausten varianssianalyysiä. Monien mielestä keskiarvojen käyttö mielipideasteikoiden kohdalla on kyseenalaista. Lue lisää artikkelistani Mielipideasteikon keskiarvo.

Riippuvat otokset – määrällinen muuttuja

Määrälliselle muuttujalle lasken keskiarvot. Testimenetelmänä voin käyttää kahden riippuvan otoksen t-testiä tai useamman ryhmän vertailuun toistomittausten varianssianalyysiä.

Erityisesti pienten otosten (n<30) kohdalla t-testin käyttäedellytykset eivät välttämättä täyty. Tällöin voin käyttää Wilcoxon merkittyjen sijalukujen testiä kahden ryhmän vertailuun tai Friedman-testiä useamman ryhmän vertailuun.

McNemar-testi

Päivitetty 26.9.2020

Kahden riippuvan otoksen McNemar-testi sopii käytettäväksi kaksiarvoisten (dikotomisten) muuttujien kanssa.

Esimerkki. Asiakkailta kysyttiin valitsisivatko he tietyn pesuainemerkin (kyllä/ei). Promootion jälkeen samoilta asiakkailta kysyttiin valitsisivatko he esitellyn pesuainemerkin. McNemar-testillä voidaan testata onko promootio saanut aikaan muutosta mielipiteissä.

Excelissä ei ole valmista toimintoa McNemar-testin laskemiseen. Onneksi versiosta 18 lähtien SPSS on sisältänyt erittäin helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Käytän yllä kuvailemaani esimerkkiä. Havainnot löytyvät SPSS-muotoisesta datasta promootio.sav (tallenna data tietokoneellesi ja avaa sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Mielipiteiden jakaumat ennen ja jälkeen promootion ovat samat. McNemar-testin p-arvo on 0,015 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa Model Viewer -ikkunassa, jos kaksoisnapsautan tulostaulukkoa.

Kruskal-Wallis -testi

Päivitetty 26.9.2020

Useamman kuin kahden riippumattoman otoksen välisen eron merkitsevyyttä voin testata yksisuuntaisella varianssianalyysillä. Varianssianalyysin käyttökelpoisuus on kyseenalaista ainakin seuraavissa tapauksissa:

  • Otoskoot ovat pieniä (alle 30) eikä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin varianssianalyysi ei tule kyseeseen.

Varianssianalyysin sijasta voin käyttää Kruskal-Wallis -testiä, jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta. Kruskal-Wallis -testi soveltuu hyvin mielipideasteikoille.

Excelissä ei ole valmista toimintoa Kruskal-Wallis -testin laskemiseen. Onneksi SPSS sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale. Ryhmittelevän muuttujan mitta-asteikon täytyy olla Nominal tai Ordinal.

Miksi tarkasteltavien muuttujien mitta-asteikon täytyy olla Scale? Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Esimerkiksi 5-portaisen tyytyväisyys-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan tyytyväisyys jatkuvaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Independent Samples. Avautuvan Nonparametric Tests: Two or More Independent Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare distributions accross groups.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse ryhmittelevä muuttuja Groups: -ruutuun ja tarkasteltavat muuttujat Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Testin tulosteena saat havainnollisen tulostaulukon. Seuraavassa on käytetty SPSS-muotoista maku.sav -aineistoa (tallenna aineisto tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan). Aineistossa on muuttujina marjojen kasvualusta  (punainen, sininen ja musta) ja marjojen maku (5-portaisella asteikolla mitatttuna: 1=selvästi keskimääräistä parempi, 5=selvästi keskimääräistä huonompi).

Taulukosta löytyy testattu nollahypoteesi, testimenetelmän nimi, p-arvo ja testin johtopäätös. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Makuarvioiden jakauma on samanlainen kaikilla kasvualustoilla. Testin mukaan ainakin joidenkin kasvualustojen välillä on eroa makuarvioiden jakaumassa (p-arvo 0,008).

SPSS tarjoaa lisätietoa jos kaksoisnapsautat tulostaulukkoa. SPSS näyttää jakaumien erot havainnollisena ruutu- ja janakaaviona (boxplot).

Kaavion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Kokeile myös kaavion alapuolelta valittavissa olevia erilaisia näkymiä (View). Erityisen hyödyllinen on Pairwise Comparisons -näkymä. Kruskal-Wallis -testin tulos kertoo ainoastaan sen, että joidenkin ryhmien välillä on merkitsevä ero. Pairwise Comparisons -näkymästä saat selville minkä ryhmien välillä on merkitseviä eroja.

Pairwise Comparisons

Esimerkkimme tapauksessa punaisen (0) ja mustan (2) kasvualustan välillä on merkitsevä ero.

Kyselylomakkeen kysymykset

Päivitetty 2.4.2019.

Valinta

Valintakysymyksessä tarjotaan kaksi tai useampia vaihtoehtoja, joista vastaaja voi valita vain yhden. Vastaajalle täytyy olla selvää, mikä vaihtoehto on hänelle oikea: Valintakysymyksen vaihtoehdot eivät siis saa mennä toistensa kanssa päällekkäin. Valintakysymyksiä käytetään erityisesti taustatietojen, kuten sukupuoli, koulutus, yrityksen toimiala jne., kysymiseen.

Joihinkin asioihin liittyviä valmiita vastausvaihtoehtoja löydät tilastokeskuksen luokituksista https://www.stat.fi/meta/luokitukset/

Jos on odotettavissa, että joillekin vastaajille mikään tarjoituista vaihtoehdoista ei sovi, niin viimeiseksi voit liittää vaihtoehdon ”Muu”, jonka vastaaja saa itse nimetä.

Monivalinta

Monivalintakysymyksessä tarjotaan kaksi tai useampia vaihtoehtoja, joista vastaaja voi valita useampiakin.

Monivalinnan voin ajatella sisältävän yhtä monta kysymystä kuin on vaihtoehtojakin. Kuhunkin kysymykseen voidaan vastata ’kyllä’ valitsemalla kyseinen vaihtoehto. Tarvittaessa voidaan mukaan liittää vaihtoehto ”Muu”, jonka vastaaja saa itse nimetä.

Jos monivalinnassa esiintyviä vaihtoehtoja on mahdollista arvioida asteikolla, niin suosi asteikkoa monivalinnan sijaan. Näin saat vastaajilta enemmän informaatiota.

Esimerkki. Voin kysyä monivalintana, mitkä tekijät vaikuttavat päivittäistavarakaupan valintaan (sijainti, tarjoukset, pysäköintitilat,…). Saan enemmän informaatiota, jos esitän kysymykset väitteinä: ”Valintaani vaikuttaa kaupan sijainti”. Väitteen yhteyteen voin liittää vastausasteikon ”täysin eri mieltä, jokseenkin eri mieltä, ei eri eikä samaa mieltä, jokseenkin samaa mieltä, täysin samaa mieltä”.

Asteikko

Asteikko on yleisimmin 3-7 -portainen, joista 5-portainen on eniten käytetty. Jos portaita on pariton määrä,esimerkiksi 5, niin keskimmäinen vaihtoehtokin on mielipide. Keskimmäinen vaihtoehto ei ole tarkoitettu niille vastaajille, jotka eivät tiedä asiasta tai eivät halua vastata. Tällaisia vastaajia varten voit tarvittaessa lisätä ylimääräisen vaihtoehdon (esimerkiksi ”Ei kokemusta asiasta”).

Asteikon vaihtoehtojen nimet valitaan tilanteen mukaan. Jos kysymyksinä käytetään väittämiä, niin asteikon vaihtoehdot voit nimetä seuraavasti: ’täysin eri mieltä, jokseenkin eri mieltä, ei eri eikä samaa mieltä, jokseenkin samaa mieltä, täysin samaa mieltä’.

Positio

Positio-kysymyksessä annetaan vastakohtapareja ja vastaaja saa valita haluamansa kohdan vastakohtaparien väliltä.

Avoin kysymys

Avointen kysymysten vastausten analysointi on aikaa vievää. Tämän vuoksi kyselylomakkeelle ei kannata laittaa kuin korkeintaan muutama avoin kysymys. Usein yksi avoin kysymys kyselylomakkeen lopussa riittää (esimerkiksi risuja ja ruusuja, kehittämisehdotuksia jne.).

Seuraavaksi

Lue ehdottomasti Muistilista kyselylomakkeen laatijalle.

Muistilista kyselylomakkeen laatijalle

Päivitetty 1.4.2019.

Älä unohda teoriaa

Kysymyksiä laadittaessa täytyy huomioida mitattavien käsitteiden ja ilmiöiden ulottuvuudet, jotka yleensä selviävät aiheeseen liittyvästä teoriasta. Jokaista ulottuvuutta varten tarvitaan yksi tai useampia kysymyksiä kyselylomakkeelle.

Esimerkki. Työtyytyväisyyden mittaamisessa voidaan hyödyntää esimerkiksi Herzbergin kahden faktorin teoriaa. Herzbergin mukaan tyytyväisyys johtuu eri tekijöistä kuin tyytymättömyys. Herzberg puhuu työtyytyväisyyttä lisäävistä motivaatiotekijöistä (ulottuvuuksista) ja tyytymättömyyttä lisäävistä hygieniatekijöistä (ulottuvuuksista).

Jokaisen vastaajan pitäisi ymmärtää ja tulkita kysymykset samalla tavalla

Hyvä kysymys on yksinkertainen, lyhyt ja selkeä. Epäselviä käsitteitä ei tulisi käyttää, ellei niitä erikseen selitetä. Huomaa, että vastaaja on harvoin yhtä perehtynyt aihepiiriin kuin tutkija. Tutkijalle hyvinkin selvät asiat tai käsitteet eivät ole sitä vastaajalle.

Esimerkki. Jos kysytään ’Onko yrityksellänne käytössä intranet’, niin osa vastaajista ei tiedä käsitteen ’intranet’ merkitystä ja loput vastaajista tulkitsevat sen kukin omalla tavallaan.

Vastaajat voivat tulkita yksinkertaiseltakin näyttävän kysymyksen eri tavoin.

Esimerkki. Jos kysytään ’Onko sinulla auto’, niin toisten mielestä työsuhdeauto aiheuttaa myönteisen vastauksen, toisten mielestä ei; toisten mielestä perheen yhteinen auto aiheuttaa myönteisen vastauksen, toisten mielestä ei. Tutkijan pitäisikin tässä tapauksessa harkita tarkkaan, mitä todella haluaa tietää, ja muotoilla kysymys sen mukaisesti.

Yhdessä kysymyksessä tulee kysyä vain yhtä asiaa

Esimerkki. ’Kuinka tyytyväinen olit asiakaspalvelun ystävällisyyteen ja henkilökunnan asiantuntemukseen?’ Tässä kysytään virheellisesti kahta asiaa ja vastaajalla voi olla täysin vastakkaiset näkemykset palvelun ystävällisyydestä ja henkilökunnan asiantuntemuksesta.

Vältä tarpeetonta kieltosanojen käyttöä

Tarpeeton kieltosanojen käyttö aiheuttaa vastaajalle ylimääräistä rasitetta ja voi johtaa virheellisiin vastauksiin.

Esimerkki. ’Etkö olisi valmis maksamaan tuotteen ympäristöystävällisyydestä?’ Kysymys on liian vaikeasti muotoiltu.

Vältä liian yleisiä kysymyksiä

Esimerkki. ’Luetko Helsingin Sanomia’ on niin yleinen kysymys, että sen avulla ei saada juurikaan mitään selville. Osa ’kyllä’-vastaajista lukee Helsingin Sanomista monenlaista aineistoa päivittäin, osa lukee vain sarjakuvat, osa lukee vain sunnuntainumeron jne. Osa ’ei’-vastaajista saattaa lukea Helsingin Sanomia silloin tällöin. Jos halutaan tietää jotain lukutiheydestä tai luetusta sisällöstä, niin kannattaa käyttää täsmällisiä kysymyksiä ja valmiit vaihtoehdot tarjoavaa asteikkoa.

Esimerkki. ’Onko sinulla sauna?’ No, saunahan voi olla kaupunki-asunnossa ja/tai kesämökillä. Kerrostalossa asuvalla voi olla yhteiskäytössä oleva sauna. Kysymystä suunniteltaessa on harkittava tarkkaan, mitä todella halutaan tietää.

Vältä epämääräisiä ilmaisuja (usein, tavallisesti, useimmat, yleensä,…), koska eri vastaajat tulkitsevat ne eri tavoin.

Esimerkki. Ei kannata kysyä ’Käytkö usein elokuvissa’.

Vastaajalla täytyy olla edellytykset vastata kysymyksiin

Kysymysten täytyy liittyä vastaajan kokemuspiiriin, jotta vastaajalla on edellytykset vastata. Vastaajan muistia ei pidä asettaa liian kovalle koetukselle. Jos on odotettavissa, että joillain vastaajilla ei ole tietoa, kokemusta tai mielipidettä kysyttävästä asiasta, niin pitää tarjota ylimääräinen vastausvaihtoehto (esimerkiksi ’En ole käyttänyt kyseistä palvelua’, ’Ei kokemusta asiasta’, ’Ei mielipidettä asiasta’). Huomaa, että mielipideasteikon keskimmäinen vaihtoehto (jos vaihtoehtoja pariton määrä) ei ole tarkoitettu vastaajille, jotka eivät tiedä kysyttävästä asiasta mitään.

Esimerkki. Jos on oletettavaa, että osalla vastaajista ei ole edellytyksiä muodostaa kantaansa esitettyyn väitteeseen, niin mieliasteikon vastausvaihtoehdot voisivat olla: ’täysin samaa mieltä, jokseenkin samaa mieltä, ei samaa eikä eri mieltä, jokseenkin eri mieltä, täysin eri mieltä, ei kokemusta asiasta’.

Vastaajalla täytyy olla motivaatio vastata kysymyksiin

Vastaajan motivaatiota voidaan parantaa kyselyn esittelyllä, jossa kerrotaan kyselyn tarkoitus ja perustellaan sen tarpeellisuus. Joidenkin kysymysten kohdalla voidaan kysymyskohtaisestikin perustella kysymyksen tarkoitusta ja tarpeellisuutta. Motivaation säilyttämiseksi kysymysten esittämisjärjestyksen pitäisi olla looginen ja järkeenkäypä. Kyselylomakkeen selkeä ja miellyttävä ulkoasu edesauttaa vastaamista. Epäselvät ja vaikeasti tulkittavat kysymykset alentavat vastaajan motivaatiota samoin kuin liian pitkät kyselyt. Vastaajan täytyy kokea, että hän voi vastata kysymyksiin rehellisesti ilman itsensä nolaamisen pelkoa.

Riippumattomat vai riippuvat otokset?

Päivitetty 25.10.2013.

Jos testaan, onko ryhmien välinen ero merkitsevä, niin joudun valitsemaan riippumattomien otosten ja riippuvien otosten testien väliltä (lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?). On siis keskeistä, että osaan tunnistaa onko kyseessä riippumattomien vai riippuvien otosten asetelma.

Riippumattomat otokset

Jos otan satunnaisotokset kahdesta eri perusjoukosta, niin kyseessä ovat toisistaan riippumattomat otokset.

Esimerkki. Jos haluan verrata kahdella eri menetelmällä valmistettujen lamppujen kestoikää, niin voin ottaa otoksen menetelmällä 1 valmistettuja lamppuja ja toisen otoksen menetelmällä 2 valmistettuja lamppuja.
Tallennan aineiston siten, että molemmilla menetelmillä valmistettujen lamppujen kestoiät ovat samassa sarakkeessa (muuttujassa). Ryhmittelyn toteutan kirjoittamalla valmistusmenetelmää kuvaavat numerot (1 tai 2) omaan sarakkeeseen (muuttujaan).

Myös saman satunnaisotoksen sisällä olevia ryhmiä voin pitää riippumattomina.

Esimerkki. Jos otan yrityksen työntekijöistä satunnaisotoksen, niin voin pitää otokseen sisältyviä naisia ja miehiä toisistaan riippumattomina otoksina (otos naisista ja otos miehistä). Jos esimerkiksi haluan tehdä palkkavertailun, niin miesten ja naisten palkat ovat samassa sarakkeessa (muuttujassa). Ryhmittelyn miehiin ja naisiin toteutan kirjoittamalla sukupuolta kuvaavat numerot omaan sarakkeeseen (muuttujaan).

Riippuvat otokset

Jos toistan mittaukset samoille tutkittaville, niin mittauskerrat muodostavat toistaan riippuvat (parittaiset) otokset.

Esimerkki. Jos mittaan samojen kuluttajien asennetta tuotteeseen ennen ja jälkeen tuote-esittelyn, niin kyseessä ovat toisistaan riippuvat otokset. Asenteen ennen tuote-esittelyä kirjoitan yhteen sarakkeeseen (muuttujaan) ja asenteen tuote-esittelyn jälkeen toiseen sarakkeeseen (muuttujaan).

Toisistaan riippuvat otokset voin muodostaa myös käyttämällä toisiaan vastaavia pareja.

Esimerkki. Verrataan kahden akkutyypin kestoa matkapuhelimissa. Testiin valitaan useita matkapuhelinmalleja, kaksi kutakin. Kustakin matkapuhelinmallista muodostetaan pari, jotta päästän testaamaan kumpaakin akkutyyppiä kyseisessä matkapuhelinmallissa. Akkutyyppeihin liittyvät otokset ovat toisistaan riippuvat. Ensimmäiseen akkutyyppiin liittyvät kestoiät kirjoitan omaan sarakkeeseen (muuttujaan) ja toiseen akkutyyppiin liittyvät kestoiät omaan sarakkeeseen (muuttujaan).

Wilcoxon merkittyjen sijalukujen testi

Päivitetty 26.9.2020

Kahden riippuvan otoksen välisen eron merkitsevyyttä voin testata kahden riippuvan otoksen t-testillä. T-testin käyttökelpoisuus on kuitenkin kyseenalaista seuraavissa tapauksissa:

  • Otoskoko on pieni (alle 30) enkä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin kahden riippuvan otoksen t-testi ei tule kyseeseen.

Kahden riippuvan otoksen t-testin sijasta voin käyttää Wilcoxon merkittyjen sijalukujen testiä (Wilcoxon signed rank test), jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta.

Excelissä ei ole valmista toimintoa Wilcoxon merkittyjen sijalukujen testin laskemiseen, mutta onneksi SPSS on sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale.  Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Testi sopii siitä huolimatta myös mielipideasteikoille. Esimerkiksi 5-portaisen mielipide-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan mielipide jatkuvavaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Esimerkki. Tietokoneohjelmien testaaja halusi tutkia onko uusi ohjelma nopeampi kuin vanha. Koska tietokoneohjelmalla suoritetaan erilaisia tehtäviä, niin testaaja arpoi ohjelman tyypillisten tehtävien joukosta 10 tehtävää. Kyseiset tehtävät suoritettiin kummallakin ohjelmalla ja suoritusajat mitattiin. Mittaukset löytyvät datasta  ohjelmat.sav (tallenna data tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Uuden ja vanhan ohjelman suoritusaikojen erojen mediaani on 0. Kaksisuuntaisen Wilcoxon merkittyjen sijalukujen testin p-arvo on 0,011 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa jos kaksoisnapsautan tulostaulukkoa. SPSS näyttää parien erotukset (Uusi-Vanha) histogrammina. Esimerkin tapauksessa yhdellä parilla on positiivinen erotus (uusi ohjelma hitaampi) ja kahdeksalla parilla on negatiivinen erotus (uusi ohjelma nopeampi). Lisäksi yhdessä parissa suoritusajat ovat samat.

Kuvion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Mittaamisen luotettavuus

Päivitetty 31.3.2019.

Mittaamisen luotettavuuden yhteydessä on tapana puhua validiteetista ja reliabiliteetista:

  • Mittaamisen validiteetti: Validiteetti on hyvä, jos mittari mittaa sitä mitä sen on tarkoituskin mitata.
  • Mittaamisen reliabiliteetti: Mittaustilanteeseen liittyvät satunnaiset virheet heikentävät reliabiliteettia.

Heikosta reliabiliteetista seuraa yleensä myös heikko validiteetti, koska satunnaisia virheitä sisältävä mittaaminen harvemmin pystyy mittaamaan sitä mitä oli tarkoitus mitata. Esimerkiksi kysymyksen satunnainen väärin ymmärtäminen heikentää reliabiliteettia, mutta samalla myös validiteetti heikkenee.

Mittaamisen heikosta validiteetista ei automaattisesti seuraa heikko reliabiliteetti. Vaikka mitataan eri asiaa kuin oli tarkoitus, niin mittaaminen voi silti olla vailla satunnaisia virheitä.

Mittarin validiteetti

Tutkimuksen tarkoitus ilmaistaan yleensä yhtenä tai useampana konkreettisena tutkimuskysymyksenä. Tutkimuskysymyksiin sisältyy keskeisiä käsitteitä, joita täytyy mitata. Seuraavassa mitattavien käsitteiden esimerkkejä eri aloilta:

  • Liimapuupalkin kestävyys.
  • Yrityksen kannattavuus.
  • Ihmisen hiilijalanjälki.
  • Asiakasuskollisuus.
  • Asiakkaan kokeman palvelun laatu.
  • Suvaitsemattomuus tupakointia kohtaan.

Jos pohdit yllä olevien käsitteiden mittaamista, niin havaitset mittaamiseen liittyviä vaikeuksia. Yllä olevista ehkä helpoin mitattava on yrityksen kannattavuus, mutta sillekään ei löydy yksikäsitteistä mittaamistapaa. Johonkin tarkoitukseen riittää liikevoiton suuruus, mutta toisiin tarkoituksiin tarvitaan useammista tunnusluvuista koostuva mittaaminen (omavaraisuusaste, tulos osaketta kohden jne.). Ihmisen hiilijalanjäljen mittaaminen vaatii paljon selvityksiä ja laskelmia. Hiilijalanjäljen mittamisessa tarvitaan aikaisempaa tutkimustietoa ja hiilijalanjälkeen liittyviä malleja ja teorioita. Tarve turvautua teorioihin on tyypillistä teoreettisten käsitteiden mittaamisen yhteydessä.

Esimerkki: Asiakkaan kokeman palvelun laatu on moniulotteinen teoreettinen käsite. Erään teorian (Parasuraman-Zeithaml-Berry) mukaan koettuun asiakaspalvelun laatuun vaikuttavat ulottuvuudet ovat luotettavuus, reagointialttius, pätevyys, saavutettavuus, kohteliaisuus, viestintä, uskottavuus, turvallisuus, asiakkaan ymmärtäminen ja tunteminen sekä fyysinen ympäristö. Jos asiakkaan kokeman palvelun laatua mitataan kyselylomakkeella käyttäen edellä mainittua teoriaa, niin jokaista edellä mainituista ulottuvuuksista täytyy mitata yhdellä tai useammalla kysymyksellä.

Mittarin validiteettia on vaikea perustella ellet perusta mittaria hyvin koetellulle teorialle. Hyvin koeteltu tilanteeseen sopiva teoria on paras tae mittarin validiteetille. Joissain tapauksessa saatat jopa löytää kirjallisuudesta valmiiksi koetellun mittarin, jonka voit pienin muutoksin sopeuttaa omaan tutkimukseesi.

Hyvin koeteltu tilanteeseen sopiva teoria on paras tae mittarin validiteetille.

Reliabiliteetti kyselytutkimuksissa

Itse mittaustilanteessa voi sattua monenlaisia satunnaisia virheitä, jotka täytyy mahdollisuuksien mukaan etukäteen eliminoida. Lue myös Muistilista kyselylomakkeen laatijalle.

Vastaaja ymmärtää kysymyksen eri tavalla kuin kysyjä tarkoittaa

Ongelma liittyy kysymyksen muotoiluun. Kysymysten täytyy olla selkeitä ja yksiselitteisiä. Vastaajalle vieraita käsitteitä täytyy välttää. Testaa kysymyksiä testivastaajilla ja selvitä miten he kysymykset ymmärtävät.

Vastaaja ei vastaa rehellisesti

Ongelma koskee erityisesti vastaajan omaan käyttäytymiseen liittyviä kysymyksiä. Jos vastaaja voi luottaa kyselyn anonyymiuteen (vastauksia ei yhdistetä missään vaiheessa vastaajan henkilötietoihin), niin epärehellisyyden riski pienenee. Jos kysely suoritetaan haastattelemalla, niin haastattelijan käytöksellä ja persoonalla saattaa myös olla osuutta vastausten rehellisyyteen.

Vastaaja ei muista vastausta oikein

Tämä on ongelma erityisesti mennyttä käytöstä koskevissa kysymyksissä. Ongelma esiintyy myös kysyttäessä esimerkiksi vastaajan työpaikan liikevaihtoa tai vastaavia tietoja. On tavallista, että vastaaja yrittää vastata jotain kysymykseen, jonka vastausta ei oikeasti muistakaan. Seurauksena on tyhjien vastausten lisäksi virheellisiä vastauksia. Kysymysten laadintavaiheessa kannattaa harkita tarkkaan muistinvaraisten kysymysten käyttö ja esitysmuoto. Testivastaajien käytöstä on tässäkin apua.

Vastaus vaihtelee satunnaisten tekijöiden johdosta

Vastaajan mielentila, vuorokaudenaika, haastattelijan käytös ja muut ympäristötekijät voivat vaikuttaa vastaajan vastaukseen. Aineiston keräämiseen liittyvät järjestelyt täytyy miettiä sellaisiksi, että ympäristötekijöiden vaikutus jää mahdollisimman vähäiseksi.

Vastaus kirjataan vahingossa väärin

Vastausten kirjaamisessa tapahtuu satunnaisia virheitä. Tällä ei yleensä ole sanottavaa vaikutusta tutkimuksen tuloksiin.

Jos vastaus kirjataan systemaattisesti väärin (esimerkiksi haastattelija kirjaa vastauksen väärää numerokoodia käyttäen), niin tutkimuksen tulokset ovat virheelliset. Kaikki merkinnät ja koodaustavat täytyy miettiä ja sopia niin tarkasti ettei systemaattisia virheitä tule.

Reliabiliteetti muissa tutkimuksissa

Jos mittauksia suoritetaan mittalaitteilla (mittanauha, vaaka, verenpainemittari jne.), niin mittauksen tarkkuus (reliabiliteetti) voi riippua seuraavista tekijöistä:

  • Mittalaitteen tarkkuus. Tämä löytyy monien mittalaitteiden osalta mittalaitteen käyttöohjekirjasta.
  • Mittaajan havaintotarkkuus. Esimerkiksi mittanauhaa luettaessa tarkkuus ei voi olla juurikaan puolta millimetriä parempi. Jos mittalaitteessa on digitaalinen numeronäyttö, niin mittaajan havaintotarkkuus ei pääse vaikuttamaan mittaukseen.
  • Ympäristöön liittyvät tekijät. Esimerkiksi verenpainemittarilla voidaan mitata korkea verenpaine sen takia että mitattava jännittää mittausta.
  • Mittaustulosten kirjaamiseen liittyvät virheet.

Kato

Päivitetty 31.3.2019.

Kato tarkoittaa kyselytutkimuksen tapauksessa niitä otokseen valittuja, jotka eivät syystä tai toisesta vastaa kyselyyn. Kato voi tarkoittaa myös yksittäisiä puuttuvia vastauksia kyselyyn vastanneiden osalta.

Kyselyiden vastausprosentit jäävät usein valitettavan alhaisiksi. Tyypillisesti vastaajia on alle 20 % otokseen valituista. Kato täytyy ennakoida otoskokoa valittaessa. Otoskoko täytyy alunperin valita niin suureksi, että kadon jälkeenkin vastaajia on riittävästi. Lopulliseen otoskokoon lasketaan vain kyselyyn vastanneet.

Katoa voin pienentää ainakin seuraavilla keinoilla:

  • Motivoin vastaajia selittämällä lyhyesti ja selkeästi kyselyn tarkoituksen ja tärkeyden.
  • Teen kyselyyn vastaamisesta mahdollisimman sujuvan ja miellyttävän tapahtuman.
  • Testaan kyselyä testivastaajilla ja pyydä heidän kommenttejaan.
  • Pidän kyselyn pituuden kohtuullisena (asetu mielessäsi vastaajan asemaan, niin tiedät mikä on kohtuullinen pituus). Testaan kyselyn pituutta testivastaajilla. Jos kaikki kysymykset eivät ole kerralla nähtävillä, niin pidän vastaajan tietoisena siitä kuinka paljon kyselystä on vielä jäljellä.
  • Pidän kyselyn anonyyminä (vastaajan henkilötietoja ei yhdistetä vastauksiin) ja kerron sen myös vastaajalle.
  • Jos mahdollista, niin nettikyselyissä lähetän muistutuksen niille, jotka eivät ole vielä vastanneet.
  • Mahdollisesti tarjoan vastanneille mahdollisuuden osallistua arvontaan. Yhteystiedot arvontaa varten kerään erilliselle lomakkeelle, jotta anonyymius säilyy.

Jos vastanneet ovat tutkimuksen kannalta keskeisissä asioissa erilaisia kuin vastaamatta jättäneet, niin kato heikentää tutkimuksen luotettavuutta. Kadon aiheuttaman virheen suuruuden arvioimiseen ei ole varmaa keinoa. Kadon vaikutusta voin arvioida kahdella tavalla:

  • Muodostan oman arvion kadon mahdollisesta vaikutuksesta luotettavuuteen. Voin myös pyytää arvioita tutkittavan ilmiön hyvin tuntevalta asiantuntijalta.
  • Jos perusjoukon taustamuuttujien jakaumat ovat tiedossa, niin vertaan otoksen jakaumia perusjoukon jakaumiin. Jos taustamuuttujien jakaumat ovat likimain samanlaiset perusjoukossa ja otoksessa, niin pidän tätä jonkinasteisena perusteluna sille, että kato ei ole vakava ongelma.

Yksittäisten kysymysten puuttuvien vastausten aiheuttaman virheen korjaamiseen on kehitetty erilaisia korvaamis- ja painottamismenetelmiä. Niiden käyttö vaatii asiaan perehtymistä eikä ehkä tule kyseeseen ensimmäistä kyselyään tekevälle. Lisätietoja aiheesta löydät Kvantitatiivisten menetelmien tietovarannosta:

Usein kysyttyä

Kysymys: Muuttuuko kokonaistutkimus kadon takia otantatutkimukseksi?

Vastaus: Ei muutu. Kokonaistutkimus on kokonaistutkimus kadosta huolimatta. Kato on sekä kokonaistutkimuksen että otantatutkimuksen ongelma.

Kyselytutkimuksen luotettavuus

Päivitetty 31.3.2019.

…virheet vältetään luotettavalla mittaamisella, oikeilla menetelmävalinnoilla ja onnistuneella otannalla.

Kyselytutkimuksen tavoitteena on hankkia tutkimuksen tarkoitukseen sopivaa tietoa, joka on todenmukaista ja virheetöntä. Tutkimuksen toteutuksessa virheiden osuus pyritään minimoimaan. Tätä varten keskeiset virhelähteet täytyy tunnistaa. Tutkimusraportissa virhelähteet ja niiden mahdollinen vaikutus tutkimustuloksiin täytyy raportoida kattavasti ja rehellisesti, jotta raportin lukijakin pystyy arvioimaan virheiden vaikutuksen tutkimuksen luotettavuuteen.

Keskeiset virhelähteet ovat selkeästi tunnistettavissa, jos kuvaan kyselytutkimusta seuraavan kuvion mukaisella mallilla (mallin idean olen ottanut kirjasta Groves, Fowler, Couper, Lepkowski, Singer & Tourangeau. Survey Methodology. Second Edition).

Kuvion mukaisesti virheet vältetään luotettavalla mittaamisella, oikeilla menetelmävalinnoilla ja onnistuneella otannalla.

Luotettava mittaaminen

Kyselytutkimuksen tuloksia ei tarkastella yksittäisen vastaajan osalta. On kuitenkin tärkeää, että mittaaminen on suoritettu siten että vastausten perusteella vastaaja pystyttäisiin kuvailemaan todenmukaisesti tutkimuksen kannalta olennaisten ominaisuuksien osalta. Muutoinhan kaikkien vastaajien vastauksista tilastollisesti muodostettu yhteenveto ei anna todenmukaista kuvaa otoksesta. Mittaamisen luotettavuutta heikentäviä tekijöitä ovat ainakin seuraavat:

Heikko validiteetti

Jos kyselylomakkeen kysymykset eivät mittaa sitä mitä niiden on tarkoitus mitata niin seurauksena on heikko validiteetti.

Heikko reliabiliteetti

Vastauksissa esiintyvät satunnaiset virheet heikentävät mittaamisen reliabiliteettia. Esimerkiksi

  • Eri vastaajat ymmärtävät kysymykset eri tavoilla.
  • Kaikki vastaajat eivät vastaa rehellisesti.
  • Kaikki vastaajat eivät muista vastausta oikein. Tämä on ongelma erityisesti mennyttä käytöstä koskevissa kysymyksissä.
  • Vastaukset vaihtelelevat satunnaisten tekijöiden johdosta (vastaajan mielentila, vuorokaudenaika, haastattelijan käytös jne.).
  • Vastaus kirjataan vahingossa väärin.

Jos mittaamisen reliabiliteetti on heikko, niin siitä seuraa myös heikko validiteetti. Eihän virheellisillä vastauksilla voida mitata luotettavasti sitä mitä on tarkoitus mitata. Päinvastainen ei välttämättä pidä paikkansa. Mittaamisen validiteetti voi olla heikko, mutta silti vastaukset voivat olla virheettömiä ja totuuden mukaisia esitettyihin kysymyksiin nähden.

Lisätietoa ja esimerkkejä mittaamisen validiteetista ja reliabiliteetista artikkelissani Mittaamisen luotettavuus.

Oikeat menetelmävalinnat

Yksittäisten vastaajien vastauksista muodostetaan otosta kuvaileva yhteenveto käyttäen taulukoita, tilastollisia tunnuslukuja ja kuvioita. Virheelliset menetelmävalinnat tai laskuvirheet heikentävät luotettavuutta. Tilastollisten menetelmien opiskelulla ja huolellisella työskentelyllä tämän vaiheen virheet voidaan välttää. Jos olet epävarma menetelmävalinnoista, niin kysy asiantuntijalta.

Onnistunut otanta

Otoksen perusteella muodostetaan kuva koko perusjoukosta. Jos otos ei vastaa ominaisuuksiltaan perusjoukkoa, niin otoksen perusteella tehdään virheellisiä päätelmiä perusjoukosta. Tässä yhteydessä käytetään usein nimitystä ulkoinen validiteetti. Jos otoksen tulokset ovat heikosti yleistettävissä perusjoukkoon, niin ulkoinen validiteetti on heikko. Otoksen onnistumista uhkaavat ainakin seuraavat tekijät:

  • Peittovirhe: Otos valitaan usein todellisen perusjoukon sijasta niin kutsutusta otantakehikosta. Otantakehikko ei sisällä välttämättä koko perusjoukkoa ja toisaalta otantakehikkoon saattaa kuulua perusjoukkoon kuulumattomia. Otantakehikosta seuraavaa virhettä kutsutaan peittovirheeksi. Tästä asiasta lisää artikkelissani Otantamenetelmä.
  • Otantamenetelmä: Jos otantamenetelmä on jokin muu kuin arvonta tai systemaattinen otanta, niin seurauksena voi olla vino otos, joka ei vastaa perusjoukkoa. Tästä asiasta lisää artikkelissani Otantamenetelmä.
  • Otantavirhe: Vaikka otanta valitaan arpomalla tai systemaattisella otannalla, niin otoksen kokoonpano vaihtelee otoksesta toiseen. Tätä vahtelua kutsutaan otantavirheeksi. Otantavirhe on sitä pienempi mitä suurempaa otosta käytän. Tästä asiasta lisää artikkelissani Otoskoko. Tilastollisen päättelyn menetelmät (virhemarginaalin laskeminen, hypoteesin testaus) liittyvät otantavirheen huomioimiseen tulosten esittämisessä.
  • Kato: Vastaamatta jättäneet voivat olla erilaisia kuin vastanneet. Tällöin kadosta seuraa virhettä tuloksiin. Kyselytutkimusten vastausprosentit ovat usein valitettavan alhaisia, joten kato voi aiheuttaa merkittävän virheen tuloksiin. Tästä asiasta lisää artikkelissani Kato.

Edellä mainituista peittovirhe ja kato ovat uhkana myös kokonaistutkimuksessa, jossa tieto pyritään keräämään koko perusjoukolta.

Kannattaa huomata, että tutkimustulokset voivat olla käyttökelpoisia vaikka otanta ei olisikaan kovin onnistunut:

Esimerkki: Oleta, että asiakaskyselyssä iso joukko asiakkaita pitää myymälän siisteyttä tärkeänä, mutta arvioi myymälän epäsiistiksi. Riippumatta otannan onnistuneisuudesta nämä ovat todellisia vastaajia ja todellisia mielipiteitä, joiden pohjalta kannattaa ryhtyä toimenpiteisiin siisteyden parantamiseksi.

Otantamenetelmä

Päivitetty 31.3.2019.

Otantakehikko on joukko, josta otos oikeasti valitaan. Otantakehikko saattaa poiketa enemmän tai vähemmän perusjoukosta.

Kokonaistutkimuksessa data kerätään koko kiinnostuksen kohteena olevasta joukosta eli perusjoukosta. Jos kokonaistutkimus ei ole mahdollinen tai tarkoituksenmukainen, niin data voidaan kerätä vain osasta perusjoukkoa (otos). Otantamenetelmällä ja otoskoolla on ratkaiseva vaikutus siihen kuinka luotettavasti otoksen avulla voidaan kuvata perusjoukkoa.

Otantakehikko

Otantakehikko on joukko, josta otos oikeasti valitaan. Otantakehikko saattaa poiketa enemmän tai vähemmän perusjoukosta.

Esimerkki. Oletetaan, että perusjoukko on Haaga-Helian ammattikorkeakoulun Pasilan toimipisteen liiketalouden opiskelijat. Jos toteutan kyselytutkimuksen Pasilan toimipisteen kahviossa, niin otantakehikko on Pasilan toimipisteen kahviossa asioivat. Otantakehikko poikkeaa ainakin kahdella tavalla perusjoukosta:

  • Osa perusjoukkoon kuuluvista ei koskaan asioi kahviossa. Jos nämä otantakehikosta puuttuvat ovat kyselytutkimuksessa kysyttävien asioiden osalta erilaisia kuin kahviossa asioivat, niin otos ei anna oikeaa kuvaa perusjoukosta.
  • Pasilassa on myös muita koulutusohjelmia kuin liiketalous, joten otantakehikko sisältää myös muita kuin liiketalouden opiskelijoita. Tämän ongelman voin ratkaista kysymällä ensimmäiseksi, onko vastaaja liiketalouden opiskelija?

Arvonta

Jos perusjoukosta on saatavilla luettelo, esimerkiksi asiakasrekisteri, niin arvonta on erinomainen otoksen valitsemistapa. Kyselytutkimusten osalta arvonta soveltuu postikyselyihin, sähköpostikyselyihin ja puhelinkyselyihin edellyttäen, että luettelossa on tarvittava yhteystieto (osoite, sähköpostiosoite, puhelinnumero). Arpomisen voin suorittaa esimerkiksi Excelillä. Tästä lisää artikkelissani Otoksen arvonta Excelillä.

Systemaattinen otanta

Systemaattinen otanta on mahdollinen, jos perusjoukko on ”jono”. Jonosta voidaan valita esimerkiksi joka kymmenes (aloituskohta pitää arpoa ensimmäisen kymmenen joukosta). Tällöin suoritetaan systemaattinen otanta, jossa poimintaväli on 10. Systemaattinen otanta soveltuu esimerkiksi liikennetutkimuksiin (pysäytetään autoja poimintavälin mukaisesti), ovensuukyselyihin (pysäytetään haastateltavia poimintavälin mukaisesti) ja laadun valvontaan (tarkastetaan tuotteita poimintavälin mukaisesti). Systemaattista otantaa voin käyttää myös, jos perusjoukosta on saatavilla luettelo (tällöin myös arvonta on mahdollinen).

Jos otantakehikko ei vastaa ajan suhteen koko perusjoukkoa, niin systemaattisen otannan tuloksena voi olla vino otos.

Esimerkki: Jos ALKOn myymälän asiakastutkimus suoritetaan ovensuukyselynä maanantaina aamupäivällä, niin vastaajat eivät luultavasti edusta myymälän koko asiakaskuntaa. Otantakehikko on tässä liian suppea ja seurauksena on todennäköisesti vinoutunut otos.

Edellisen esimerkin tapauksessa sopivan otantakehikon valitsemiseksi kannattaa käyttää kaikkea saatavilla olevaa taustatietoa erilaisten asiakkaiden jakautumisesta eri ajankohdille. Toki on myös mahdollista rajata perusjoukkoa. Edellisen esimerkin tapauskessa perusjoukko voidaan rajata maanantai aamupäivän asiakkaisiin.

Ositettu otanta

Otoksen edustavuutta tutkimuksen kannalta tärkeän avainmuuttujan suhteen voidaan parantaa ositetulla otannalla. Tällöin avainmuuttujan jakauma perusjoukossa täytyy olla etukäteen tiedossa.

Esimerkki. Oletetaan, että perusjoukko on Haaga-Helian ammattikorkeakoulun opiskelijat. Haaga-Heliassa on useita koulutusohjelmia. Koulutusohjelmien opiskelijamäärät ovat tiedossa. Voin ottaa otoksen kustakin koulutusohjelmasta (esimerkiksi arpomalla) siten että otoskoot ovat suhteessa koulutusohjelmien opiskelijamääriin. Eri koulutusohjelmista otetut otokset muodostavat kokonaisotoksen, joka on siis valittu ositettua otantaa käyttäen.

Näyte

Jos tutkittavat valitaan jollain muulla tavalla kuin sattumaa hyödyntäen (arpomisessa ja systemaattisessa otannassa hyödynnetään sattumaa), niin valittua joukkoa on syytä kutsua näytteeksi. Näytteen perusteella ei yleensä voi tehdä yhtä luotettavia yleistyksiä laajempaan perusjoukkoon kuin otoksen perusteella. Otoksen edustavuuden takeena on sattuma: Jokaisella perusjoukon edustajalla on tiedossa oleva todennäköisyys tulla valituksi otokseen. Riittävän suurta otoskokoa käytettäessä sattuma huolehtii siitä, että otos edustaa hyvin perusjoukkoa.

Vaikka näytteestä laskettuja jakaumia, eroja ja riippuvuuksia ei sellaisenaan voi yleistää laajempaan perusjoukkoon, niin näyte voi silti antaa arvokasta tietoa. Näytteen mielipiteet ovat oikeiden vastaajien oikeita mielipiteitä, joihin on syytä suhtauta vakavasti.

Harkinnanvarainen näyte

Harkinnanvarainen näyte syntyy silloin kun näytteen valinnassa käytetään sattuman sijasta tutkijan harkintaa. Harkinnanvarainen näyte edustaa parhaassa tapauksessa hyvin perusjoukkoa, mutta pahimmassa tapauksessa näyte kuvastaa tutkijan pyrkimystä saada tutkimuksesta tietynlaisia etukäteen päätettyjä tuloksia.

Itsevalikoitunut näyte

Iltapäivälehden nettisivulla olevaan kyselyyn vastanneet muodostavat itsevalikoituneen näytteen. Itsevalikoitunut näyte ei yleensä ole edustava otos mistään järkevästä perusjoukosta.

Mukavuuspoiminta

Jos lähetän kyselyn sosiaalisen median verkostoilleni, niin voin kutsua tätä mukavuuspoiminnaksi. Näin syntyvä näyte ei yleensä ole edustava otos mistään järkevästä perusjoukosta.

Dokumentointi

…otoksen/näytteen poimintamenetelmä täytyy dokumentoida mahdollisimman yksityiskohtaisesti.

Olipa sitten kyseessä otos tai näyte, niin tulosten lukijalle täytyy antaa mahdollisuus arvioida otoksen/näytteen edustavuutta. Tämä tarkoittaa sitä, että otoksen/näytteen poimintamenetelmä täytyy dokumentoida mahdollisimman yksityiskohtaisesti. Kaikki tutkijan tekemät valinnat täytyy kirjoittaa näkyviin perusteluineen.

Mann-Whitney U -testi

Päivitetty 26.9.2020

Kahden riippumattoman otoksen välisen eron merkitsevyyttä voin testata kahden riippumattoman otoksen t-testillä. T-testin käyttökelpoisuus on kyseenalaista ainakin seuraavissa tapauksissa:

  • Otoskoko on pieni (alle 30) eikä olla varmoja ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olet sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin kahden riippumattoman otoksen t-testi ei tule kyseeseen.

Kahden riippumattoman otoksen t-testin sijasta voin käyttää Mann-Whitney U -testiä, jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta. Mann-Whitney U -testi soveltuu hyvin mielipideasteikoille.

Excelissä ei ole valmista toimintoa Mann-Whitney U -testin laskemiseen. Onneksi SPSS sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale. Ryhmittelevän muuttujan mitta-asteikon täytyy olla Nominal tai Ordinal.

Miksi tarkasteltavien muuttujien mitta-asteikon täytyy olla Scale? Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Esimerkiksi 5-portaisen tyytyväisyys-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan tyytyväisyys jatkuvaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Independent Samples. Avautuvan Nonparametric Tests: Two or More Independent Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare distributions accross groups.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse ryhmittelevä muuttuja Groups: -ruutuun ja tarkasteltavat muuttujat Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Seuraavassa on testattu data1.xlsx -aineistolle miesten ja naisten tyytyväisyyksien eroja (avatessasi aineistoa SPSS:llä valitse Worksheet-asetukseksi Data). Ryhmittelevänä muuttujana (Groups) on ’Sukupuoli’ ja testattavina muuttujina (Testi Fields) ’Tyytyväisyys johtoon’, ’Tyytyväisyys työtovereihin’ jne. Testin tulosteena saat havainnollisen tulostaulukon.Taulukosta löytyy kullekin muuttujalle testattu nollahypoteesi, testimenetelmän nimi, p-arvo ja testin johtopäätös. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Tarkasteltavan muuttujan jakauma on sama molemmissa ryhmissä. Esimerkiksi muuttujan ”Tyytyväisyys johtoon” tapauksessa miesten ja naisten mielipidejakaumien välillä on merkitsevä ero (kaksisuuntaisen Mann-Whitney U -testin p-arvo=0,003). SPSS tarjoaa lisätietoa jos kaksoisnapsautat tulostaulukkoa. SPSS näyttää jakaumien eron havainnollisena kuviona:

Kuvion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Mitä Mann-Whitney U -testillä itse asiassa testataan?

Kirjallisuudessa Mann-Whitney U -testissä testattavat hypoteesit esitetään monin eri tavoin. Usein hypoteesit on muotoiltu siten, että testataan mediaanien yhtäsuuruutta. Tällöin edellytetään, että muuttujien jakaumat ovat likimain samanmuotoiset.

Mann-Whitney U -testi perustuu sijalukuihin. Tarkasteltavan muuttujan arvot laitetaan suuruusjärjestykseen ja niille annetaan suuruusjärjestykseen pohjautuvat sijaluvut. Sijalukujen summa on T=n(n+1)/2. Jos jakaumat ovat samankaltaiset, niin ryhmän sijalukujen summan pitäisi olla (n1/n)×T (ryhmän kokoa n1 vastaava osuus sijalukujen summasta T). P-arvo kertoo todennäköisyyden sille, että ryhmän sijalukujen summa poikkeaa otoksessa havaitun verran tai enemmän odotetusta, jos oletetaan nollahypoteesin pitävän paikkansa. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea.

Otoksen arvonta Excelillä

Päivitetty 1.4.2019.

Luettelon ensimmäisessä sarakkeessa täytyy olla numeromuotoista tietoa (esimerkiksi juokseva numero).

Jos perusjoukosta on saatavilla Excel-muotoinen luettelo, niin voin poimia luettelosta otoksen. Luettelon ensimmäisessä sarakkeessa täytyy olla numeromuotoista tietoa (esimerkiksi juokseva numero). Tarvittaessa lisään ylimääräisen sarakkeen juoksevalle numerolle. Otoksen poiminnan toteutan analyysityökalujen Sampling (Otanta) -toiminnolla.

Jos käytät analyysityökaluja ensimmäistä kertaa, niin

  • Valitse vasemmalta ylhäältä File – Options (Tiedosto – Asetukset).
  • Valitse vasemmalta Add Ins (Apuohjelmat) ja valitse sitten alhaalta Manage (Hallinta) -ruudusta Excel Add Ins (Excel-apuohjelmat).
  • Valitse Go (Siirry).
  • Valitse luettelosta Analysis ToolPak (Analyysityökalut) ja valitse OK. Jos Excel huomauttaa, että analyysityökaluja ei ole asennettu, niin valitse Yes (Kyllä) asentaaksesi ne.

Kun olet ottanut käyttöön analyysityökalut, niin voit käyttää Data (Tiedot) -välilehden Analysis (Analyysi) -ryhmässä olevaa Data Analysis (Tietojen analysointi) -komentoa. Kun valitset analyysityökaluista Sampling (Otanta), niin pääset Sampling (Otanta) -valintaikkunaan.

Sampling

Input Range (Syöttöalue): Viittaus ensimmäisen sarakkeen numeromuotoiseen tietoon.

Labels: Tämän kohdan valitsen ainoastaan, jos syöttöalue sisältää otsikon (en näe mitään syytä, miksi otsikko pitäisi sisällyttää syöttöalueeseen).

Sampling Method (Otantamenetelmä): Valitsen jommankumman tarjotuista vaihtoehdoista.

  • Periodic (Jaksollinen) tarkoittaa systemaattista otantaa: Jos kirjoitan periodiksi esimerkiksi 10, niin otokseen poimitaan joka kymmenes.
  • Random (Satunnaisluku) tarkoittaa arvontaa ja otoskoon kirjoitan Number of Samples (Otantojen lukumäärä) -ruutuun.

Output options (Tulostusasetukset): Voin ohjata tulokset alkavaksi tietystä solusta tai uuteen taulukkoon tai työkirjaan.

Edellä olen määritellyt poimittavaksi 30 kappaleen arvotun otoksen solualueesta A2:A384. Tulokset sijoitetaan samaan taulukkoon solusta O2 alkaen.

Sama numero voi sattua otokseen mukaan useamman kuin yhden kerran. Ylimääräiset esiintymät voin poistaa Excelin Remove Duplicates (Poista kaksoiskappaleet) -toiminnolla:

  • Valitsen otantaan valitut numerot.
  • Valitsen Data – Remove Duplicates (Tiedot – Poista kaksoiskappaleet).
  • OK.

Jos aion lähettää posti- tai nettikyselyn, niin otoksen numeroiden sijasta tarvitsen yhteystietoja. Voin käyttää Excelin VLOOKUP (PHAKU) -funktiota etsimään luettelosta numeroita vastaavilta riveiltä muiden sarakkeiden tietoja. Esimerkiksi funktion

=VLOOKUP(O2;$A$2:$M$384;4;0)

toimintaperiaate on seuraava:

  • Ensimmäinen argumentti: Hakuarvona käytetään solun O2 arvoa.
  • Toinen argumentti: Solun O2 mukaista arvoa etsitään hakualueen A2:M384 ensimmäisestä sarakkeesta (VLOOKUP etsii aina hakuarvoa hakualueen ensimmäisestä sarakkeesta). Huomaa $-merkit, jotka tarkoittavat kiinteää viittausta. Käytän kiinteää viittausta, jotta viittaus ei muutu kopioidessani funktiota muille riveille.
  • Kolmas argumentti: Kun solun O2 mukainen arvo löytyy, niin funktio palauttaa kyseiseltä riviltä 4. sarakkeen tiedon.
  • Funktion viimeinen argumentti 0 (nolla) tarkoittaa sitä, että funktio etsii täsmälleen hakuarvon mukaista arvoa.

Jos haluat harjoitella otoksen poimimista, niin voit käyttää tilauksia.xlsx. Tiedosto sisältää yrityksen vastaanottamia tilauksia, joista voit poimia otoksia.

Otoskoko

Päivitetty 31.3.2019.

Pieni otos voi sattumalta poiketa paljonkin perusjoukosta. Tämä niin kutsuttu otantavirhe on sitä suurempi mitä pienempää otosta käytän.

Kokonaistutkimuksessa data kerätään koko kiinnostuksen kohteena olevasta joukosta eli perusjoukosta. Jos kokonaistutkimus ei ole mahdollinen tai tarkoituksenmukainen, niin data voidaan kerätä vain osasta perusjoukkoa. Jos osa valitaan satunnaisuutta hyödyntäen, esimerkiksi arpomalla, niin osaa voidaan kutsua otokseksi.

Jos otoksen keräämisen tarkoituksena on saada tietoa koko perusjoukosta, niin otoskoon on oltava riittävän suuri. Pieni otos voi sattumalta poiketa paljonkin perusjoukosta. Tämä niin kutsuttu otantavirhe on sitä suurempi mitä pienempää otosta käytän.

Mitään yksiselitteistä ihanteellista otoskokoa ei ole, mutta suuntaviivoja erilaisiin tilanteisiin voin silti antaa.

Keskiarvo

Jos tutkittavan muuttujan arvojen jakauma perusjoukossa on likimain normaalijakauma ja vaihtelua on vähän, niin jo muutaman kymmenen kappaleen otoksella voin saada perusjoukon keskiarvolle riittävän tarkan arvion.

Esimerkki. Sarjatuotannossa valmistetaan ominaisuuksiltaan likimain tasalaatuisia tuotteita. Satunnaisista tekijöistä johtuvaa pientä vaihtelua esiintyy, mutta vaihtelun tiedetään noudattavan likimain normaalijakaumaa. Tilastollisella laadunvalvonnalla voidaan varmistaa, että tuotteiden ominaisuudet ovat keskiarvoltaan tavoitteiden mukaisia. Tällöin voidaan käyttää pieniä otoksia. Laadunvalvonnassa käytetään joissain tapauksissa jopa alle 10 kappaleen otoksia.

Jos ei ole varmuutta siitä, että muuttujan arvot ovat perusjoukossa likimain normaalisti jakautuneet, niin otoskoon täytyy olla suurempi. On osoitettu, että vasta noin otoskoosta 30 alkaen otosten keskiarvot alkavat  vakiintua. Otoskokoa 30 voisikin yleisessä tapauksessa pitää otoskoon alarajana.

Jos tutkittavan muuttujan arvoissa on paljon vaihtelua, niin tämä täytyy huomioida kasvattamalla otoskokoa.

Voit kokeilla otoskoon ja vaihtelun (keskihajonta) vaikutusta keskiarvon virhemarginaaliin Excel-laskurilla virhemarginaali.xlsx.

Jos haluan vertailla otoksen sisällä olevien ryhmien keskiarvoja, niin kustakin ryhmästä olisi hyvä olla vähintään 30 edustajaa. Jos esimerkiksi haluaisin vertailla viiden eri ikäryhmän ulkomaanmatkoihin käyttämää rahamäärää, niin tarvitsen otoksen, jossa on vähintään 30 edustajaa kustakin ikäryhmästä. Tämä tarkoittaa vähintään 150 kappaleen otosta. Jos ikäryhmät ovat perusjoukossa eri kokoisia, niin tarvitsen vieläkin isommman otoksen, jotta saan pienimmästäkin ikäryhmästä mukaan 30 edustajaa.

Mitä isompaa otosta käytän sitä pienemmän perusjoukossa esiintyvän ryhmien välisin eron pystyn otoksellani tunnistamaan.

Ristiintaulukointi

Jos esimerkiksi ristiintaulukoin ikäryhmän mielipideasteikolla mitatun mielipiteen kanssa, niin kyseessä on  ryhmien vertailu (voin myös puhua ikäryhmän ja mielipiteen välisestä riippuvuudesta). Tässä on syytä olla mukana vähintään 30 edustajaa kustakin ryhmästä, aivan kuten ryhmien keskiarvoja vertailtaessa. Jos otoskoko on liian pieni, niin khiin neliö -testin käyttöedellytykset eivät täyty enkä pääse testaamaan erojen tilastollista merkitsevyyttä.

Mitä isompaa otosta käytän sitä pienemmän perusjoukossa esiintyvän ryhmien välisin eron pystyn otoksellani tunnistamaan.

Suunnitellessani otoskokoa ajattelen asiaa kaikkien aikomieni ristiintaulukointien kannalta. Valitsen otoskoon pahimman tapauksen mukaan. Pahin tapaus on ristiintaulukointi, joka asettaa kovimmat vaatimukset otoskoolle.

Prosenttiluku

Puolueiden kannatuksia mittaavissa mielipidekyselyissä käytetään tyypillisesti noin 1000 henkilön otoksia. Tällaisella otoksella virhemarginaali on noin kolme prosenttiyksikköä. Tästä huomaat, että prosenttiluvun tarkkaan arviointiin tarvitaan isoja otoksia. Otoskoolla 100 päästään noin kymmenen prosenttiyksikön virhemarginaaliin ja otoskoolla 10000 noin yhden prosenttiyksikön virhemarginaaliin.

Voit kokeilla otoskoon vaikutusta virhemarginaaliin Excel-laskurilla virhemarginaali.xlsx. Huomaa, että prosenttiluvun suuruus vaikuttaa asiaan. Virhemarginaali on suurimmillaan 50 prosentin kohdalla. Tämä on helppo ymmärtää, koska vaihtelu on 50 prosentin kohdalla suurimmillaan (puolet on yhtä mieltä ja puolet vastakkaista mieltä).

Huono otos

Jos vastaamatta jättäneet ovat mielipiteiltään erilaisia kuin vastanneet, niin kato vinouttaa otosta. Suurempi otoskoko ei paranna kadon aiheuttamaa vinoutumista.

Yleensä suuri joukko kyselytutkimukseen valituista jättää vastaamatta. Lopulliseen kyselytutkimuksen otoskokoon lasketaan mukaan ainoastaan vastanneet. Vastaamatta jättäneitä kutsutaan kadoksi. Jos vastaamatta jättäneet ovat mielipiteiltään erilaisia kuin vastanneet, niin kato vinouttaa otosta. Suurempi otoskoko ei paranna kadon aiheuttamaa vinoutumista.

Mahdollinen kato täytyy kuitenkin huomoida otosta valittaessa. Alkuperäinen otos täytyy valita niin suureksi, että kadon jälkeenkin otoskoko jää riittävän suureksi.

Otos voi vinoutua myös silloin, jos otos valitaan joukosta, joka ei täysin vastaa perusjoukkoa. Joukkoa, josta otos valitaan kutsutaan otantakehikoksi.

Esimerkki: Jos ALKOn myymälän asiakastutkimus suoritetaan ovensuukyselynä maanantaina aamupäivällä, niin vastaajat eivät luultavasti edusta myymälän koko asiakaskuntaa. Otantakehikko on tässä liian suppea ja seurauksena on todennäköisesti vinoutunut otos. Vinoutuma ei korjaannu vaikka otosta kasvatetaan maanantai-aamupäivän asiakkailla.

Otos voi olla huono myös johtuen huonosta otantamenetelmästä. Jos otoksen valinnassa ei hyödynnetä asianmukaista otantamenetelmää, niin otosta pitäisi kutsua näytteeksi. Näytteen tuloksien yleistämiseen laajempaan perusjoukkoon täytyy suhtautua varauksella.

Käsitteiden selventämistä

Perusjoukko: Joukko, jota halutaan tutkia.

Kokonaistutkimus: Tutkitaan koko perusjoukko (poislukien kato).

Otantakehikko: Joukko, josta otos valitaan. Käytännön syistä otantakehikosta saattaa puuttua osa perusjoukosta ja otantakehikkoon voi kuulua perusjoukkoon kuulumattomia.

Otos: Otantakehikosta asianmukaista otantamenetelmää käyttäen valittu osa (poislukien kato).

Näyte: Otantakehikosta valittu osa (poislukien kato).

P-arvo

Päivitetty 25.10.2013.

Tilastollisen testauksen logiikka vastaa monin tavoin oikeudenkäynnin logiikkaa. Oikeudenkäynnissä oletetaan, että henkilö on syytön kunnes toisin osoitetaan. Tilastollisessa testauksessa oletetaan nollahypoteesin pitävän paikkansa kunnes toisin osoitetaan. Nollahypoteesi on usein muotoa ’ei eroa’ tai  ’ei riippuvuutta’. Esimerkiksi

  • Miehet ja naiset ovat yhtä tyytyväisiä työympäristöön.
  • Tehtyjen harjoitustehtävien määrän ja tenttimenestyksen välillä ei ole riippuvuutta.
  • Miesten reaktioaika ei muutu alkoholin nauttimisen seurauksena.

Tilastollisessa testauksessa oletetaan nollahypoteesin pitävän paikkansa kunnes toisin osoitetaan.

Todistustaakka on syyttäjällä, tilastollisessa testauksessa tutkijalla. Syyttäjä kerää oikeudenkäyntiä varten todisteita syyllisyyden puolesta. Tilastollisessa testauksessa tutkija kerää otoksen kiinnostuksen kohteena olevasta perusjoukosta.

Tutkija vertaa otoksen tulosta nollahypoteesiin. Pelkästään otantavirheen takia otoksen tulos poikkeaa enemmän tai vähemmän nollahypoteesista. Isoja poikkeamia ei kuitenkaan voida selittää pelkästään otantavirheellä.  Vastaavalla tavalla syyttäjä voi esittää niin vahvoja todisteita syyllisyyden puolesta, että niitä ei voida selittää pelkästään sattumalla. Jos syytetty on tavattu ryöstön jälkeen ryöstöpaikan läheisyydestä kädessään ryöstösaalista ja toisessa kädessä ase, niin harva uskoo tämän kaiken aiheutuneen sattumalta, ilman että syytetty olisi osallinen ryöstöön.

Pelkästään otantavirheen takia otoksen tulos poikkeaa enemmän tai vähemmän nollahypoteesista. Isoja poikkeamia ei kuitenkaan voida selittää pelkästään otantavirheellä.

Tilastollisen testauksen keskeinen kysymys on: kuinka iso poikkeama nollahypoteesista on liian iso selitettäväksi pelkällä otantavirheellä? Asian selventämiseksi tutkija laskee kuinka yllättävänä otoksessa havaittua voidaan pitää, jos oletetaan nollahypoteesin pitävän paikkansa. Tätä kutsutaan p-arvoksi.

Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea ja sitä enemmän todisteet puhuvat nollahypoteesia vastaan.

Jos esimerkiksi tutkija saa p-arvoksi 0,001 eli 0,1 %, niin otoksen tulos on yllättävä. P-arvoa 0,001 on tulkittava seuraavasti: Jos nollahypoteesin oletetaan pitävän paikkansa, niin otoksen kaltainen tai vielä enemmän nollahypoteesista poikkeava tulos sattuu kohdalle yhdessä otoksessa tuhannesta. Kyseessä on siis melko yllättävä tulos. Tämä jos mikä on riittävä todiste nollahypoteesia vastaan. Tuloshan ei nimittäin olekaan enää yllättävä, jos nollahypoteesi ei pidäkään paikkansa. Seuraavassa kolme näkökulmaa p-arvon ymmärtämiseksi:

  • P-arvo on todennäköisyys sille, että otoksen tulos poikkeaa havaitun verran tai vieläkin enemmän nollahypoteesista (kun oletetaan, että nollahypoteesi pitää paikkansa).
  • P-arvo on todennäköisyys sille, että havaittu poikkeama nollahypoteesista voidaan selittää pelkästään otantavirheellä.
  • Jos nollahypoteesi päätetään hylätä, niin p-arvo ilmoittaa päätökseen liittyvän erehtymisriskin.

Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea ja sitä enemmän todisteet puhuvat nollahypoteesia vastaan. Kuinka pieni p-arvon sitten täytyy olla, jotta nollahypoteesi voidaan hylätä? Yleisimmin käytetty raja on 0,05 eli 5 %. Tämä on kuitenkin täysin mielivaltainen raja ja tapauskohtaista harkintaa on syytä käyttää. Kovin korkealle rajaa ei kuitenkaan voi nostaa. Tämän ymmärtää hyvin vertaamalla tilannetta oikeudenkäyntiin. Tuskin henkilöä päätetään tuomita, jos päätökseen liittyvä erehtymisriski on esimerkiksi 30 %. Oikeudenkäynnissä tilanne on käytännössä hankalampi, koska p-arvon kaltaista todennäköisyyttä ei yleensä ole laskettavissa.

On tärkeää huomata, että tilastollisessa testauksessa ei koskaan osoiteta nollahypoteesia oikeaksi. Todisteet joko riittävät nollahypoteesin hylkäämiseen tai eivät riitä. Vaikka todisteet eivät riitäkään nollahypoteesin hylkäämiseen, niin käytössä ei ole todisteita, jotka osoittaisivat nollahypoteesin oikeaksi. Vähän vastaavalla tavalla voidaan ajatella oikeudenkäynnistäkin. Vaikka todisteet eivät olekaan riittävät syyllisyyden osoittamiseksi, niin eivät ne toisaalta vastaansanomattomasti todista syytetyn syyttömyyttäkään.

On tärkeää huomata, että tilastollisessa testauksessa ei koskaan osoiteta nollahypoteesia oikeaksi.

P-arvoon viittaan artikkeleissani:

Kahden riippuvan otoksen vertailu

Päivitetty 20.4.2019.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon (samaan tulokseen päädyn, jos lasken reaktioaikojen keskiarvojen eron).

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Riippuvia otoksia voidaan kutsua myös parittaisiksi otoksiksi.

Mitä enemmän erojen keskiarvo poikkeaa nollasta sitä enemmän minulla on perusteita väittää, että alkoholia nauttineilla on eri suuruinen reaktioaika. Pieni poikkeama nollasta voi kuitenkin selittyä otantavirheellä. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö erojen keskiarvon poikkeama nollasta pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippuvan otoksen t-testin (myös nimitystä parittaisten otosten t-testi käytetään). T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että erojen keskiarvon poikkeama nollasta selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Vakiintuneen tavan mukaan alle 0,050 (5,0 %) suuruista p-arvoa pidetään riittävänä näyttönä perusjoukossa olevan eron puolesta.

Testin suorittamiseksi minun täytyy valita suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Kaksisuuntainen vai yksisuuntainen testi

Jos etukäteen ajateltuna ei ole käsitystä siitä onko erojen keskiarvo positiivinen vai negatiivinen, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain tietyn merkkinen erojen keskiarvo tulee kyseeseen tai olen yksinomaan kiinnostunut tietyn merkkisestä erosta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa pienempi poikkeama riittää tilastollisesti merkitsevään testitulokseen.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä. Tällöin myös mittausten erojen keskiarvon laskeminen on mielekästä.

Jos otoskoko on vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että erot ovat likimain normaalisti jakautuneet. Jos mitattavat muuttujat voidaan olettaa normaalijakautuneiksi, niin sitä suuremmalla syyllä myös mittausten ero voidaan olettaa normaalijakautuneeksi. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa).  Epäselvissä tapauksissa voin yrittää arvioida normaalijakautuneisuutta otosten erojen jakauman perusteella (voin käyttää esimerkiksi histogrammia tai ruutu- ja janakaaviota).

Testin p-arvon laskeminen Excelillä

Voin laskea testin p-arvon Excelin funktiolla =T.TEST(otos1;otos2;suuntaisuus;tyyppi)

  • otos1: viittaus ensimmäiseen otokseen
  • otos2: viittaus toiseen otokseen
  • suuntaisuus: 2 kaksisuuntaiselle testille, 1 yksisuuntaiselle testille
  • tyyppi: 1 riippuvien otosten t-testille

Suomenkielisessä Excelissä funktion nimi on T.TESTI.

Funktion nimeä vaihdettiin Excelin versioon 2010. Aikasemmissa versioissa funktion nimi on TTEST (TTESTI). Vanha funktion nimi toimii edelleen uudemmissa Excelin versioissa.

Esimerkki. Tiedostossa reaktioajat.xlsx on kuvitteellinen esimerkkiaineisto reaktioajoista. Ensimmäisen mittauksen reaktioajat ovat soluissa B2:B16 ja toisen otoksen reaktioajat soluissa C2:C16. P-arvon laskemiseen (yksisuuntainen) voidaan käyttää funktiota =T.TEST(B2:B16;C2:C16;2;1)

Esimerkkiaineiston p-arvo on pienempi kuin 0,001, mikä tarkoittaa erojen keskiarvon tilastollisesti merkitsevää poikkeamaa nollasta.

Testin tulosten raportointi

Tuloksen voin raportoida monellakin tavalla. Tärkeintä on, että otosten keskiarvot, keskihajonnat, otoskoko ja testin p-arvo ovat näkyvillä. Esimerkiksi:

Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025, n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023, n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,621, p < 0,001, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,621. Testimuuttujan arvon ja vapausasteluvun saat Excelin analyysityökaluilla (katso reaktioajat.xlsx) tai käyttämällä valmista laskentapohjaa tiedostossa otantavirhe.xlsx.

SPSS

Jos haluat suorittaa testauksen SPSS:llä, niin lue artikkelini SPSS: Kahden riippuvan otoksen vertailu.

Muita menetelmiä kahden riippuvan otoksen vertailuun

Jos keskiarvo ei sovellu tarkasteltavalle muuttujalle, niin tarjolla on kaksi hyvää vaihtoehtoa:

  1. Jos tarkasteltava muuttuja on kaksiarvoinen (joko/tai), niin voit käyttää McNemar-testiä. Voit esimerkiksi testata ostohalukkuuden eroa ennen ja jälkeen tuote-esittelyn. Excelissä ei ole valmista toimintoa testin laskemiseen. SPSS soveltuu hyvin testin laskemiseen.
  2. Jos otoskoko on alle 30 etkä ole varma normaalijakautuneisuudesta, niin riippuvien otosten t-testin sijasta voit käyttää Wilcoxon merkittyjen sijalukujen testiä. Excelissä ei ole valmista toimintoa testin laskemiseen. SPSS soveltuu hyvin testin laskemiseen.

Kahden riippumattoman otoksen vertailu

Miesten reaktioaikaa voin tutkia myös toisenlaisella tutkimusasetelmalla:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Tässä asetelmassa otokset ovat toisistaan riippumattomat ja vertailuun täytyy käyttää kahden riippumattoman otoksen t-testiä.

Usein kysyttyä

Kysymys: Olen laskenut keskiarvot ja keskihajonnat, mutta alkuperäinen aineisto ei ole Excelissä. Voinko silti laskea kahden otoksen t-testin.

Vastaus: Voit. Käytä Exceliin laatimaani laskentapohjaa otantavirhe.xlsx. Syötä laskentapohjaan otoskoko, erojen keskiarvo ja erojen keskihajonta.

Kysymys: Voinko laskea virhemarginaalin erojen keskiarvolle?

Vastaus: Kyllä. Käytä Exceliin laatimaani laskentapohjaa otantavirhe.xlsx. Syötä laskentapohjaan otoskoko, erojen keskiarvo ja erojen keskihajonta.

Kahden riippumattoman otoksen vertailu

Päivitetty 20.4.2019.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Mitä enemmän otosten keskiarvot poikkeavat toisistaan sitä enemmän minulla on perusteita väittää, että alkoholi vaikuttaa miesten reaktioaikaan. Pienet erot keskiarvoissa voivat selittyä otantavirheellä. Reaktioajoissa on luontaista vaihtelua miesten välillä ja on sattuman varassa minkälaisen reaktioajan omaavat miehet otoksiin valikoituvat. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö keskiarvojen ero pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippumattoman otoksen t-testin. T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että keskiarvojen ero selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Vakiintuneen tavan mukaan alle 0,050 (5,0 %) suuruista p-arvoa pidetään riittävänä näyttönä perusjoukossa olevan eron puolesta.

Testin suorittamiseksi minun täytyy valita suoritanko yhtäsuurten vai erisuurten varianssien testin sekä suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Yhtäsuurten vai erisuurten varianssien testi?

Kahden riippumattoman otoksen t-testistä on kaksi versiota.

  • Yhtäsuurten varianssien testi sopii tilanteisiin, joissa verrattavien ryhmien varianssit (varianssi on keskihajonnan toinen potenssi) ovat likimain yhtäsuuret.
  • Erisuurten varianssien testiä taas voidaan käyttää tilanteisiin, joissa verrattavien ryhmien varianssien yhtäsuuruutta ei voida olettaa.

Kysymys: Mistä tiedän pitääkö käyttää yhtäsuurten vai erisuurten varianssien testiä?

Vastaus: Jos olet epävarma, niin käytä erisuurten varianssien testiä. Jos tiedät perusjoukoissa varianssien olevan likimain yhtäsuuret ja otosten varianssitkin tukevat tätä käsitystä, niin voit käyttää yhtäsuurten varianssien testiä.

Jos olet epävarma, niin käytä erisuurten varianssien testiä.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna kumman tahansa ryhmän keskiarvo voi olla toista suurempi, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain toisen ryhmän keskiarvo voi olla suurempi tai olen yksinomaan kiinnostunut toisen ryhmän keskiarvon suuremmuudesta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa keskiarvojen tilastollisesti merkitsevä ero saavutetaan pienemmällä keskiarvojen erolla.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä.

Jos otoskoot ovat vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että tarkasteltava muuttuja on perusjoukossaan likimain normaalisti jakautunut. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa). Epäselvissä tapauksissa voin yrittää arvioida normaalijakautuneisuutta otoksen arvojen jakauman perusteella (voin käyttää esimerkiksi histogrammia tai ruutu- ja janakaaviota).

Testin p-arvon laskeminen Excelillä

Voin laskea testin p-arvon Excelin funktiolla =T.TEST(otos1;otos2;suuntaisuus;tyyppi)

  • otos1: viittaus ensimmäiseen otokseen
  • otos2: viittaus toiseen otokseen
  • suuntaisuus: 2 kaksisuuntaiselle testille, 1 yksisuuntaiselle testille
  • tyyppi: 2 yhtäsuurten varianssien testille, 3 erisuurten varianssien testille

Suomenkielisessä Excelissä funktion nimi on T.TESTI.

Funktion nimeä vaihdettiin Excelin versioon 2010. Aikasemmissa versioissa funktion nimi on TTEST (TTESTI). Vanha funktion nimi toimii edelleen uudemmissa Excelin versioissa.

Esimerkki. Tiedostossa reaktioajat.xlsx on kuvitteellinen esimerkkiaineisto reaktioajoista. Ensimmäisen otoksen reaktioajat ovat soluissa C2:C16 ja toisen otoksen reaktioajat soluissa C17:C31. P-arvon laskemiseen (kaksisuuntainen, erisuurten varianssien testi) voin käyttää funktiota =T.TEST(C2:C16;C17:C31;2;3)

Esimerkkiaineiston p-arvo on noin 0,006 (0,6 %), mikä tarkoittaa tilastollisesti merkitsevää keskiarvojen eroa.

Testin tulosten raportointi

Tuloksen voin raportoida monellakin tavalla. Tärkeintä on, että otosten keskiarvot, keskihajonnat, otoskoot ja testin p-arvo ovat näkyvillä. Esimerkiksi:

Alkoholia nauttineiden reaktioaikojen keskiarvo 0,237 sekuntia (keskihajonta = 0,035, n=15) poikkesi raittiiden reaktioaikojen keskiarvosta 0,205 sekuntia (keskihajonta = 0,020, n=15). Ero osoittautui riippumattomien otosten t-testillä merkitseväksi: t(22) = -3,045, p = 0,006, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(22) = -3,045. Testimuuttujan arvon ja vapausasteluvun saat Excelin analyysityökaluilla (katso reaktioajat.xlsx) tai käyttämällä valmista laskentapohjaa tiedostossa otantavirhe.xlsx.

SPSS

Jos haluat suorittaa testauksen SPSS:llä, niin lue artikkelini SPSS: Kahden riippumattoman otoksen vertailu.

Muita menetelmiä kahden riippumattoman otoksen vertailuun

Kahden riippumattoman otoksen t-testi soveltuu kokeelliseen tutkimusasetelmaan, jossa vertaillaan kahta riippumatonta otosta, kuten tämän artikkelin reaktioaika-esimerkissä. Testiä voidaan käyttää myös ei-kokeellisissa tutkimusasetelmissa. Esimerkiksi kyselytutkimusainestossa voidaan verrata eläkeläisten ja työssäkäyvien TV:n katseluun käytettyä aikaa.

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

Kahden riippuvan otoksen vertailu

Miesten reaktioaikaa voin tutkia myös toisenlaisella tutkimusasetelmalla:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon.

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Tällaisessa asetelmassa otosten vertailuun täytyy käyttää riippuvien otosten t-testiä.

Usein kysyttyä

Kysymys: Olen laskenut keskiarvot ja keskihajonnat, mutta alkuperäinen aineisto ei ole Excelissä. Voinko silti laskea kahden otoksen t-testin.

Vastaus: Voit. Käytä Exceliin laatimaani laskentapohjaa otantavirhe.xlsx. Syötä laskentapohjaan molempien otosten otoskoot, keskiarvot ja keskihajonnat.

Kysymys: Millä tavoin erisuurten ja yhtäsuurten varianssien t-testien laskentatavat eroavat toisistaan?

Vastaus: Lue lisätietoa.

Kysymys: Voinko laskea virhemarginaalin otoskeskiarvojen erolle?

Vastaus: Kyllä. Lue lisätietoa ja käytä Exceliin laatimaani laskentapohjaa otantavirhe.xlsx. Syötä laskentapohjaan molempien otosten otoskoot, keskiarvot ja keskihajonnat.

Paha piirakkakaavio

Päivitetty 28.3.2013

Numerotietoa voidaan havainnollistaa kaavion avulla. Kaavio täyttää tarkoituksensa jos se pelkistää esitettävän asian helposti ymmärrettävään muotoon ja jos sen avulla lukija hahmottaa tiedon nopeammin kuin pelkkinä numeroina esitettynä. Piirakkakaavio on suosittu havainnollistamistapa. Suosiostaan huolimatta piirakkakaavion havainnollisuuden voi kyseenalaistaa.

Kahta lukua ei tarvitse havainnollistaa kaaviona

Kahden prosenttiluvun esittäminen piirakkakaaviona on tilaa vievä esitystapa. Monilla on tapana käyttää paljon vieressä olevaa kookkaampia piirakoita. Piirakka on myöskin epätarkka. Vai osaatko päätellä siivujen prosenttiosuudet ilman, että prosenttiluvut ovat kaaviossa näkyvillä? Saman tiedon saan ilmaistua täsmällisemmin ja lyhyemmin suorasanaisessa lauseessa: Tutkituista 7,5 % (24 kpl) oli naisia ja 92,5 % (296 kpl) miehiä. Mielestäni kahden prosenttiluvun tapauksessa suoransanainen kertominen on riittävän havainnollinen.

Pylväskaavio toimi piirakkakuviota paremmin

En voi suositella piirakkakaaviota useammankaan prosenttiluvun esittämiseen. Vai mitä mieltä olet piirakkakaavion tarkkuudesta ja havainnollisuudesta verrattuna vaakapylväskaavioon?

Piirakkakaavion siivujen kokojen silmämääräinen vertailu ei ole helppoa. Yllä olevasta piirakkakaaviosta näen, että siivut ovat kuta kuinkin samankokoisia. Samoista luvuista tehty pylväskaavio sen sijaan paljastaa välittömästi, että C on suurin ja A on yhtäsuuri kuin B.

Erikoistehosteet vain pahentavat asiaa

Kolmiulotteiseksi tehostetun piirakkakaavion siivujen kokojen silmämääräinen vertailu on suorastaan mahdotonta. Osaisitko pelkän piirakkakaavion perusteella päätellä, että D on täsmälleen yhtäsuuri kuin A tai B?

Samoista luvuista tehty pylväskuvio paljastaa heti, että A, B ja D ovat samansuuruisia. Tilanne pahenee tästäkin, jos yksi tai useampia piirakkakaavion siivuista on repäisty piirakasta irralleen.

Piirakkakaaviota pahempi on monta piirakkakaaviota

Pahempi kuin piirakkakaavio on monta piirakkakaaviota. Koetapa vertailla onko siivujen A, B, C, D ja E kokojen järjestys erilainen eri piirakoissa. Tarkkasilmäinen ehkä pystyy huolellisen tarkastelun jälkeen vertailun tekemään, mutta havainnolliseksi esitystapaa ei voi sanoa.

Samoista luvuista laadittujen pylväskaavioiden avulla vertailu onnistuu. Vasemmanpuoleisen kaavion tapauksessa A, B, C, D ja E muodostavat nousevan sarjan. Keskimmäisessä kaaviossa C on pienin ja D suurin. Oikeanpuoleisessa kaaviossa A, B, C, D ja E muodostavat laskevan sarjan.

Yhteenveto

Älä käytä piirakkakaaviota. Älä ainakaan tutkimusraportissa.

Korrelaatio ja sen merkitsevyys

Päivitetty 17.4.2019. Tämä on Akin menetelmäblogin luetuin artikkeli!

Hallitset jo toivottavasti ristiintaulukoinnin. Ristiintaulukointi on sopiva menetelmä kahden kategorisen muuttujan riippuvuuden tarkasteluun. Kahden määrällisen muuttujan riippuvuutta puolestaan tarkastellaan hajontakaavion ja korrelaatiokertoimen avulla.

Hajontakaavio

Käytän esimerkkinä tiedostosta korrelaatio.xlsx löytyvää dataa, jossa on kolme muuttujaa: opiskelijan läsnäolo lähiopetustunneilla, suoritettujen harjoitustehtävien lukumäärä ja tentin pistemäärä. Haluan selvittää onko lähiopetustunneille osallistumisella ja suoritettujen harjoitustehtävien lukumäärällä yhteyttä tenttipistemäärään.

Saan havainnollisen kuvan asiasta tekemällä hajontakaaviot. Excelissä hajontakaavio on nimeltään Scatter (Piste). Läsnäolon ja tenttipisteiden välisessä hajontakaaviossa en näe merkittävää yhteyttä, vaan havaintopisteet ovat melko satunnaisesti jakautuneet.

Suoritetut harjoitustehtävät sen sijaan näyttävät olevan positiivisessa yhteydessä tenttipistemäärään. Hajontakaaviossa tämä näkyy selvästi nousevana pisteparvena. Alhaiset harjoitustehtävien määrät näyttävät liittyvän alhaisiin tenttipistemääriin ja korkeat harjoitustehtävien määrät näyttävät liittyvän korkeisiin tenttipistemääriin.

Korrelaatiokerroin

Korrelaatiokerroin on tunnusluku suoraviivaisen riippuvuuden voimakkuudelle. Excelissä voin laskea korrelaation funktiolla CORREL (KORRELAATIO). Funktion ensimmäiseksi lähtötiedoksi annetaan viittaus ensimmäisen muuttujan arvoihin ja toiseksi lähtötiedoksi viittaus toisen muuttujan arvoihin.

Korrelaatiokertoimen arvo voi olla mitä tahansa -1 ja +1 väliltä. Lähellä nollaa olevat kertoimet liittyvät tilanteisiin, joissa ei ole suoraviivaista riippuvuutta. Lähellä +1 olevat kertoimet viittaavaat positiiviseen riippuvuuteen (nouseva pisteparvi hajontakaaviossa) ja lähellä -1 olevat kertoimet viittaavat negatiiviseen riippuvuuteen (laskeva pisteparvi hajontakaaviossa).

korre

Esimerkkidatassa läsnäolon ja tenttipistemäärän välinen korrelaatiokerroin on 0,27 ja harjoitusten ja tenttipistemäärän välinen korrelaatiokerroin on 0,84. Korrelaatiokertoimet siis kertovat samaa kuin hajontakaaviot.

Korrelaation merkitsevyys

Jos data pohjautuu laajemmasta perusjoukosta satunnaisesti valittuun otokseen, niin tietyin edellytyksin voin yleistää otoksen tuloksia perusjoukkoon. Korrelaation tapauksessa tämä tarkoittaa muuttujien välisen korrelaation yleistämistä perusjoukkoon.

Pienet korrelaatiot voin selittää otantavirheellä. Otoksessa havaitun korrelaation täytyy olla riittävän suuri, jotta voin yleistää sen perusjoukkoon. Suuruutta testaan vertaamalla korrelaatiokerrointa hypoteettiseen tilanteeseen, jossa ei ole lainkaan korrelaatiota (korrelaatiokerroin on 0). Jos otoksesta laskettu korrelaatiokerroin poikkeaa riittävästi nollasta, niin voin kutsua korrelaatiota tilastollisesti merkitseväksi.

Korrelaatiokertoimen merkitsevyyden testaamiseksi lasketaan niin kutsuttu p-arvo, joka vastaa seuraavaan kysymykseen: kuinka todennäköistä on saada havaitun suuruinen tai vielä kauempana nollasta oleva korrelaatiokertoimen arvo ilman että korrelaatiota on perusjoukossa? Mitä pienempi p-arvo on sitä enemmän korrelaation yleistäminen perusjoukkoon saa tukea.

Vakiintuneen tavan mukaisesti alle 0,05 (5 %) suuruista p-arvoa pidetään riittävänä näyttönä perusjoukossa esiintyvän korrelaation puolesta.

Jos haluat tietää p-arvon laskentaperusteesta, niin lue artikkeli Korrelaatio – lisätietoa.

Voit käyttää p-arvon laskemiseen valmista laskentapohjaa testaa_korrelaatio.xlsx. Kirjoita laskentapohjaan otoskoko ja korrelaatiokerroin, jonka jälkeen voit lukea p-arvon. Käytä 2-suuntaista p-arvoa, jos testaat sitä onko korrelaatio nollasta poikkeava. Käytä 1-suuntaista p-arvoa, jos testaat pelkästään korrelaation positiivisuutta tai pelkästään korrelaation negatiivisuutta.

Jos testaan läsnäolotuntien ja tenttipistemäärän välisen korrelaation positiivisuutta, niin saan 1-suuntaiseksi p-arvoksi 0,143 (otoskoko 17, korrelaatiokerroin 0,2746). Tuloksen voin raportoida esimerkiksi seuraavasti (yleisesti käytössä oleva merkintä korrelaatiokertoimelle on r):

Läsnäolotuntien ja tenttipistemäärän välillä ei ole tilastollisesti merkitsevää positiivista korrelaatiota (r=0,27; n=17; 1-suuntaisen testin p-arvo=0,143).

Jos testaan suoritettujen harjoitusten ja tenttipistemäärän välisen korrelaation positiivisuutta, niin saan 1-suuntaiseksi p-arvoksi 0,000 (otoskoko 17, korrelaatiokerroin 0,8438). Tuloksen voin raportoida esimerkiksi seuraavasti:

Suoritettujen harjoitusten ja tenttipistemäärän välillä on positiivinen korrelaatio (r=0,84; n=17; 1-suuntaisen testin p-arvo<0,001).

Tilastollisen merkitsevyyden ohella kannattaa pohtia myös käytännön merkitsevyyttä. Korrelaatiokerroin voi olla tilastollisesti merkitsevä ja silti vailla käytännön merkitsevyyttä. Yksinkertainen tapa käytännön merkitsevyyden arviointiin on hajontakaavion tarkastelu. Jos et näe hajontakaavion pisteparvessa merkittävää säännönmukaisuutta niin saattaa olla että korrelaatiolla ei ole käytännön merkitsevyyttä.

Poikkeavat arvot

Hajontakaaviossa selvästi muista poikkeavat pisteet ovat ongelmallisia korrelaatiokerrointa käytettäessä. Lue lisää artikkelista Poikkeavat arvot.

Lisätietoa

Artikkelissa Korrelaatiokerroin – lisätietoa on yksityiskohtaisempaa tietoa korrelaatiokertoimen laskennasta, p-arvon laskennasta ja ohje korrelaatiokertoimen luottamusvälin laskentaan.

SPSS

SPSS tulostaa korrelaatiokerrointen yhteyteen automaattisesti p-arvot. Lue lisää SPSS monisteesta spss19.pdf.

Keskiarvon virhemarginaali

Päivitetty 19.4.2019.

Otoksen keskiarvo on otoksen keskiarvo. Jos yleistän otoskeskiarvon laajempaan perusjoukkoon, niin minun täytyy huomoida otantavirheen aiheuttama epävarmuus. Otantavirheen aiheuttaman epävarmuuden ilmaisen virhemarginaalin avulla.

Virhemarginaalin laskeminen ja tulkinta

Funktiolla CONFIDENCE.T (LUOTTAMUSVÄLI.T) voin laskea virhemarginaalin. Funktiolle annan kolme lähtötietoa:

  1. 5 % (jos lasken 95 % virhemarginaalin)
  2. otoksen keskihajonta
  3. otoskoko.

Esimerkki.  Eräästä ammattiryhmästä valittiin 200 henkilön satunnaisotos. Henkilöiltä kysyttiin kesän aikana lomamatkoihin käytettyä rahamäärää. Otoksen keskiarvoksi laskettiin 562 € ja keskihajonnaksi 119 €. Virhemarginaaliksi saan funktiolla =CONFIDENCE.T(5 %;119;200) noin 17 €. Virhemarginaalin avulla voin laskea luottamusvälin alarajan 562-17=545 ja ylärajan 562+17=579. Tämä tarkoittaa sitä, että 95 % varmuudella perusjoukon keskiarvo on välillä 545 € – 579 €. Tuloksen voin raportoida esimerkiksi seuraavasti:

Ammattiryhmän jäsenet (n=200) käyttivät kesän aikana lomamatkoihin keskimäärin 562 € (keskiarvo). Keskiarvon 95 % luottamusväli on 545 € – 579 €.

Voit laskea virhemarginaalin ja luottamusvälin myös valmista laskuria käyttäen: virhemarginaali.xlsx.

Tärkeää

Virhemarginaalin arvo on luotettava ainoastaan jos otos on valittu perusjoukosta asianmukaista otantamenetelmää käyttäen.

Usein kysyttyä

Kysymys: Millä laskentakaavalla Excel laskee virhemarginaalin?

Vastaus: CONFIDENCE.T laskee virhemarginaalin kaavalla

virhemarg

Kriittinen arvo kerrotaan otoksesta lasketulla keskihajonnalla ja jaetaan otoskoon neliöjuurella. Kriittinen arvo on t-jakaumasta peräisin oleva otoskoosta riippuva arvo. Mitä isompi otos sitä enemmän t-jakauma alkaa muistuttaa normaalijakaumaa. Tähän perustuen joissain lähteissä kriittisenä arvona käytetään normaalijakauman kriittistä arvoa 1,96. Jos haluat tietää enemmän, niin lue lisätietoa.

Kysymys: Miten menetellään, jos perusjoukon keskihajonta on tiedossa?

Vastaus: Tällöin on aivan oikein käyttää laskennassa normaalijakauman kriittistä arvoa 1,96. Tätä varten on oma funktio CONFIDENCE.NORM (LUOTTAMUSVÄLI.NORM), jonka toisena lähtötietona on perusjoukon keskihajonta.

Tunnuslukuja

Päivitetty 21.4.2019.

Määrällisten muuttujien tapauksessa ei kannata pihtailla tunnuslukujen kanssa. Määrälliselle muuttujalla kannattaa laskea ainakin

  • keskiarvo ja keskihajonta
  • viiden luvun yhteenveto (pienin, alaneljännes eli alakvartiili, mediaani, yläneljännes eli yläkvartiili, suurin)
  • havaintojen lukumäärä (n).

Keskiarvo ja mediaani

Keskiarvo (arvojen summa jaettuna arvojen lukumäärällä) ja mediaani (suuruusjärjestykseen järjestettyjen arvojen keskimmäinen tai kahden keskimmäisen keskiarvo) pyrkivät mittaamaan jakauman keskikohtaa. Jos keskiarvo ja mediaani ovat lähellä toisiaan, niin tämä viittaa jakauman symmetrisyyteen. Muista arvoista selvästi poikkeavat arvot vaikuttavat voimakkaasti keskiarvoon:

  • Jos keskiarvo on mediaania suurempi, niin tämä viittaa oikealle vinoon jakaumaan.
  • Jos keskiarvo on mediaania pienempi, niin tämä viittaa vasemmalle vinoon jakaumaan.

Poikkeavista arvoista ja niihin suhtautumisesta voit lukea lisää artikkelista Poikkeavat arvot.

Jos keskiarvo ja mediaani poikkeavat selvästi toisistaan, niin mediaani on yleensä paremmin jakauman keskikohtaa kuvaava luku.

Keskihajonta

Keskihajonta pyrkii mittaamaan arvojen vaihtelua keskiarvon molemmin puolin. Keskihajonta ilmaisee havaintojen keskimääräisen poikkeaman keskiarvosta. Pelkästään keskihajonnan lukuarvon perusteella on vaikeaa muodostaa mielikuvaa arvojen vaihtelusta. Keskihajonta on kuitenkin tilastollisessa mielessä tärkeä tunnusluku, jota käytetään muun muassa keskiarvon virhemarginaalin laskemiseen.

Viiden luvun yhteenveto

Viiden luvun yhteenveto antaa hyvän kuvan arvojen vaihtelusta. Viiden luvun yhteenvedon avulla arvojen vaihteluväli pienimmästä suurimpaan jaetaan neljään osaan:

  • pienimmän ja alanejänneksen välinen osa sisältää 25 % arvoista
  • alaneljänneksen ja mediaanin välinen osa sisältää 25 % arvoista
  • mediaanin ja yläneljänneksen välinen osa sisältää 25 % arvoista
  • yläneljänneksen ja suurimman välinen osa sisältää 25 % arvoista.

Laskenta Excelin funktioilla

Voin laskea tunnuslukuja datan yläpuolelle, alapuolelle, viereen, toiseen taulukkoon  tai jopa  toiseen työkirjaan. Minulla on tapana laskea tunnuslukuja datan yläpuolelle. Tätä varten lisään datan yläpuolelle riittävän määrän tyhjiä rivejä (yhden enemmän kuin laskettavia tunnuslukuja, jotta tunnuslukujen ja datan väliin jää tyhjä rivi). Jollen tarvitse ensimmäiseen sarakkeeseen tunnuslukuja, niin kirjoitan siihen itseäni varten laskettavien tunnuslukujen nimet (keskiarvo, keskihajonta jne.). Tunnuslukujen laskennan suoritan Excelin funktioilla:

  • =AVERAGE(alue) (KESKIARVO)
  • =STDEV.S(alue) (KESKIHAJONTA.S)
  • =MIN(alue) (MIN)
  • =PERCENTILE.EXC(alue;25 %) (PROSENTTIPISTE.ULK)
  • =MEDIAN(alue) (MEDIAANI)
  • =PERCENTILE.EXC(alue;75 %) (PROSENTTIPISTE.ULK)
  • =MAX(alue) (MAKS)
  • =COUNT(alue) (LASKE)

Funktioiden vaatima lähtötieto ’alue’ on viittaus arvoihin, joista tunnusluku lasketaan. Alaneljännes ja yläneljännes lasketaan samalla funktiolla PERCENTILE.EXC, jolle pitää ylimääräisenä lähtötietona antaa 25 % (alaneljännes) tai 75 % (yläneljännes). Huomaa, että lähtötietojen väliin kirjoitetaan puolipiste.

Vanhempien Excel-versioiden käyttäjille: Excel 2010:een tuli joitain uudistuksia funktioihin. Excel 2007 ja sitä vanhemmissa käytetään STDEV.S sijasta funktiota STDEV (KESKIHAJONTA) ja PERCENTILE.EXC sijasta funktiota PERCENTILE (PROSENTTIPISTE). PERCENTILE.EXC saattaa antaa hieman PERCENTILE-funktiosta poikkeavan tuloksen, mutta erolla ei yleensä ole käytännön merkitystä (lisätietoa). Vanhat funkiot toimivat edelleen uudemmissa versioissa.

Seuraavassa olen lisännyt 9 tyhjää riviä datan data1.xlsx yläpuolelle. Esimerkiksi keskiarvon olen laskenut funktiolla =AVERAGE(B11:B92) ja alaneljänneksen funktiolla =PERCENTILE.EXC(B11:B92;25 %). Sarakkeeseen B laskemani funktiot olen kopioinut muihin sarakkeisiin: Valitsin solut B1:B8, tartuin hiirellä kiinni valittujen solujen oikean alakulman neliöstä ja vedin oikealle.

Kuvaamallani menettelyllä tulen laskeneeksi tarpeettomiakin tunnuslukuja. Esimerkiksi sukupuolelle ainoastaan vastausten lukumäärä (n) on käyttökelpoinen tunnusluku. Tarpeettomia tunnuslukuja en tietenkään raportoi.

Raportointia varten tunnuslukuja kannattaa kopioida uuteen taulukkoon. Liittäminen täytyy tehdä arvoina käyttäen Paste Values (Liitä arvot) -toimintoa. Desimaalien määrä täytyy säätää tilanteeseen sopivaksi. Esimerkiksi palkkaan liittyvät tunnusluvut voin esittää seuraavasti:

Taulukosta näen keskiarvoa ja mediaania vertaamalla, että aineistossa on joitain erityisen suuria palkkoja. Tämä käsitys vahvistuu, kun katson suurinta arvoa. Viiden luvun yhteenveto antaa hyvän mielikuvan siitä miten palkat ovat jakaantuneet. Voin esimerkiksi todeta, että puolella työntekijöistä palkka on välillä 2027 euroa – 2817 euroa.

Tunnuslukuja ryhmittäin

Jos haluan vertailla miesten ja naisten palkkajakaumaa, niin lasken palkan tunnuslukuja sukupuolen määräämissä ryhmissä. Voin tehdä tämän esimerkiksi seuraavasti:

  • Lasken tunnusluvut koko aineistolle.
  • Lajittelen (järjestän) aineiston ryhmittelevän muuttujan (esimerkiksi sukupuoli) mukaan.
  • Teen aineistosta kopioita (pidän  ctrl-näppäintä alhaalla ja raahan alareunan taulukonvalitsinta hieman oikealle).
  • Poistan kopioista ne rivit, jotka eivät kuulu haluamaani osa-aineistoon.
  • Osa-aineiston tunnusluvut voin kopioida uuteen taulukkoon vierekkäin, jolloin vertailu käy mahdolliseksi.

Toinen mahdollisuus on käyttää AGGREGATE (KOOSTE) -funktiota yhdessä aineiston suodatuksen kanssa.

 Aggregate-funktio

Voin laskea tunnusluvut siten, että tunnusluvun arvo vaihtuu aineiston suodatuksen (Filter) mukana. Jos suodatus ei ole sinulle tuttua, niin lue artikkeli Excel Table (Taulukko). Laskennan toteutan käärimällä tunnuslukufunktion AGGREGATE (KOOSTE) -funktion sisään.

  • Aloitan funktion rakentamisen kirjoittamalla suoraan tyhjään soluun funktion nimen alkua =AG, jonka jälkeen Excel jo ehdottaakin AGGREGATE-funktiota. Jos hyväksyn Excelin ehdotuksen tab/sarkain-näppäimellä, niin Excel täydentää funktion nimen ja lisää sulkumerkin =AGGREGATE(.
  • Sulkumerkin jälkeen Excel tarjoaa luetteloa tilastollisia tunnuslukuja laskevista funktioista. Valitsen luettelosta haluamani funktion. Voin liikkua luettelossa nuolilla ja valita tab/sarkain-näppäimellä tai hiiren kaksoisnapsauksella.
  • Seuraavaksi kirjoitan lähtötietojen väliin erotinmerkiksi puolipisteen ;
  • Puolipisteen jälkeen Excel tarjoaa monenlaisia oudonnäköisiä vaihtoehtoja, joista valitsen vaihtoehdon 5 (Ignore hidden rows), jonka ansiosta funktio reagoi suodatuksiin.
  • Seuraavaksi kirjoitan lähtötietojen väliin erotinmerkiksi puolipisteen ;
  • Puolipisteen jälkeen näytän hiirellä ne arvot, joista lasken tunnuslukua.
  • Jos en ole laskemassa ala- tai yläneljännestä, niin kirjoitan sulkumerkin ) ja napsautan enter-painiketta. Jos olen laskemassa ala- tai yläneljännestä, niin kirjoitan puolipisteen ; ja viimeiseksi argumentiksi 25 % (alaneljännes) tai 75 % (yläneljännes).

Voin tämän jälkeen todeta, miten funktion tulos vaihtuu suodatusten mukana. Voin helposti esimerkiksi suodattaa näkyville miehet ja kopioida miesten tunnusluvut jonnekin. Tämän jälkeen voin suodattaa näkyville naiset ja kopioida naisten tunnusluvut miesten tunnuslukujen viereen. Muistan tietysti käyttää liittämiseen Paste Values (Liitä arvot) -toimintoa.

Pienin palkka näyttää olevan miehellä. Miesten ja naisten alaneljännekset eivät poikkea paljoa toisistaan. Mediaani ja yläneljännes ovat miehillä selvästi suuremmat. Naisten joukossa ei ole suuripalkkaisia lainkaan.

Graafinen esittäminen

Graafiseen esittämiseen ruutu- ja janakaavio on erinomainen valinta. Ruutu- ja janakaavio havainnollistaa viiden luvun yhteenvedon.

Seuraavaksi

Katso Excel-esimerkkejä tunnuslukuja.xlsx.

Otoskesta lasketut tunnusluvut kuvailevat lähtökohtaisesti otosta. Jos otoksesta laskettuja tunnuslukuja yleistetään laajempaan perusjoukkoon, niin yleistämiseen liittyy otantavirheen aiheuttamaa epävarmuutta. Keskiarvon kohdalla epävarmuuden suuruus voidaan ilmaista virhemarginaalin avulla. Tästä enemmän artikkelissa Keskiarvon virhemarginaali.

Mielipideasteikon keskiarvo

Päivitetty 17.4.2019.

Datassa data1.xlsx on muiden muassa vastauksia kysymyksiin, joissa on kysytty tyytyväisyyttä eri asioihin. Asteikkona on viisiportainen mielipideasteikko:

  • 1 erittäin tyytymätön
  • 2 tyytymätön
  • 3 ei tyytymätön eikä tyytyväinen
  • 4 tyytyväinen
  • 5 erittäin tyytyväinen

Mielipiteiden jakauman voin esittää yhteenvetotaulukkona, jossa on eri mielipiteiden lukumäärät (ja/tai prosentit). Tästä voit lukea aiemmasta artikkelistani 3 Taulukointi. Jos haluan esittää pikayhteenvedon tyytyväisyyksistä eri asioihin, niin voin laskea mielipiteiden keskiarvot:

Keskiarvon perusteella voin muodostaa mielikuvan vastaajien keskimääräisestä mielipiteestä. Erityisesti tarkastan kaksi asiaa:

  • Onko keskiarvo tyytymättömän vai tyytyväisen puolella eli alle vai yli 3?
  • Kuinka kaukana asteikon keskikohdasta keskiarvo on?

Keskihajonta ilmaisee, kuinka paljon mielipiteet keskimäärin poikkeavat keskiarvosta? Keskihajonnan perusteella voin muodostaa mielikuvan mielipiteiden vaihtelusta. Mitä suurempi keskihajonta, sitä enemmän mielipiteet ovat vaihdelleet.

On tärkeää ilmoittaa myös keskiarvon taustalla olevien mielipiteiden eli vastausten lukumäärä (n).

Voinko käyttää keskiarvoja?

Joissain menetelmäoppaissa kielletään, toisissa taas sallitaan keskiarvon käyttö mielipideasteikon yhteydessä. Keskiarvon käyttökieltoa perustellaan sillä, että mielipide on kategorinen (tarkemmin ottaen järjestysasteikollinen) muuttuja, jolle ei ole mielekästä laskea keskiarvoa. Tällöin ajatellaan, että mielipeasteikko ei mittaa tasavälisesti mielipiteen määrää. Keskiarvon käyttöä taas perustellaan sillä, että mielipideasteikkoa voidaan pitää kuta kuinkin tasavälisenä asteikkona, joka mittaa mielipiteen määrää. Tätä perustelua ei kuitenkaan voida vastaansanomattomasti osoittaa oikeaksi.

Käytäntö on osoittanut, että keskiarvot antavat useimmissa tapauksissa oikeansuuntaisen ja käyttökelpoisen arvion keskimääräisestä mielipiteestä. Keskiarvon käytössä kannattaa kuitenkin huomoida seuraavat seikat:

  • Mielipiteiden jakauma pitää aina tarkistaa lukumäärä/prosentti-taulukosta. Erikoisten jakaumien kohdalla keskiarvoihin pitää suhtautua varoen. Äärimmäinen esimerkki: Viisiportaisen mielipideasteikon keskiarvoksi saadaan 3, jos kaikki mieliteet ovat 3; samaan keskiarvoon päädytään jos puolet mielipiteistä on 1 ja puolet 5.
  • Keskiarvon lisäksi kannattaa laskea keskihajonta, joka mittaa mielipiteiden vaihtelua.
  • Jos vastaajille on tarjottu muitakin vaihtoehtoja kuin varsinaisen mielipideasteikon arvoja (esimerkiksi ’En tiedä asiasta’), niin nämä täytyy jättää keskiarvon laskennan ulkopuolelle. Tämän voin käytännössä toteuttaa tekemällä aineistostani keskiarvojen laskentaa varten kopion, jossa korvaan laskennan ulkopuolelle jätettävät arvot tyhjillä soluilla tai tekstimuotoisella tiedolla Excelin Home (Aloitus) -välilehden Find&Select – Replace (Etsi ja valitse – Korvaa) -toiminnolla.
  • Lukumäärät ja/tai prosentit sisältävä yhteenvetotaulukko on tyhjentävä esitys mielipiteiden jakaumasta ja näin ollen aina tarkempi kuin keskiarvo.

Kukin tehköön oman ratkaisunsa keskiarvojen käyttämisestä tai käyttämättä jättämisestä.

Keskiarvojen laskenta pivot-taulukkoon

Jos haluan laskea keskiarvot datan data1.xlsx tyytyväisyysmuuttujille, niin toimin seuraavasti:

  • Valitsen täsmälleen yhden solun datan alueelta.
  • Valitsen Insert (Lisää) -välilehdeltä PivotTable (Pivot-taulukko).
  • Raahaan tyytyväisyysmuuttujat yksi kerrallaan kenttäluettelon (PivotTable Field List) Values (Arvot) -ruutuun.
  • Vaihdan kunkin Values (Arvot) -ruudun kentän laskentaperusteeksi Average (Keskiarvo). Laskentaperusteen vaihtoon pääsen napsauttamalla kenttää ja valitsemalla avautuvasta valikosta Value Field Settings (Arvokentän asetukset).
  • Lopuksi raahaan sarakeotsikoiden (Column Labels)  Values (Arvot) -palikan riviotsikoihin (Row Labels), jotta saan keskiarvot allekkain.

Pivot-taulukko pitkine otsikoineen ja liikoine desimaaleineen kaipaa jonkin verran viimeistelyä.

Keskihajonnat saan laskettua vastaavalla tavalla:

  • Valitsen täsmälleen yhden solun datan alueelta.
  • Valitsen Insert (Lisää) -välilehdeltä PivotTable (Pivot-taulukko).
  • Raahaan tyytyväisyysmuuttujat yksi kerrallaan kenttäluettelon (PivotTable Field List) Values (Arvot) -ruutuun.
  • Vaihdan kunkin Values (Arvot) -ruudun kentän laskentaperusteeksi StdDev (Keskihajonta). Laskentaperuteen vaihtoon pääsen napsauttamalla kenttää ja valitsemalla avautuvasta valikosta Value Field Settings (Arvokentän asetukset).
  • Lopuksi raahaan sarakeotsikoiden (Column Labels)  Values (Arvot) -palikan riviotsikoihin (Row Labels), jotta saan keskihajonnat allekkain.

Tämän jälkeen teen vielä kolmannen pivot taulukon, johon lasken vastausten määrät (Count).

Voin kopioida keskiarvot, keskihajonnat ja vastausten määrät uuteen taulukkoon vierekkäin.

Jos tarkasteltavilla asioilla ei ole mitää luontaista järjestystä, niin tunnuslukuja sisältävä taulukko kannattaa järjestää keskiarvojen mukaiseen järjestykseen.

Järjestämisen voin tehdä valitsemalla taulukon sisällön sarakeotsikoita lukuunottamatta. Tämän jälkeen valitsen Home (Aloitus) -välilehdeltä Sort&Filter – Custom Sort (Lajittele ja suodata – Mukautettu lajittelu). Lajitteluperusteeksi (Sort by) valitsen keskiarvon.

Taulukosta nähdään, että kaikkein tyytymättömimpiä oltiin palkkaan (keskiarvo=2,1) ja kaikkein tyytyväisimpiä työtovereihin (keskiarvo=4,1). Muiden asioiden kohdalla keskiarvot ovat lähellä mielipideasteikon keskikohtaa. Tyytyväisyys työympäristöön jakoi mielipiteitä eniten (keskihajonta=1,2). Tyytyväisyys palkkaan jakoi mielipiteitä vähiten (keskihajonta=0,8).

Graafinen esittäminen

Huolellisesti viimeistelty keskiarvot, keskihajonnat ja n-arvot sisältävä taulukko on havainnollinen ja  täsmällinen esitystapa. Näin ollen graafista esittämistä ei tarvita. Jos kuitenkin haluat havainnollistaa keskiarvoja graafisesti, niin voit käyttää pylväskaaviota.

On tärkeää katkaista arvoakseli alkamaan mielipideasteikon pienimmän arvon kohdalta (tässä 1). Myös arvoakselin otsikointiin on kiinnitettävä erityistä huomiota. Jos haluat kerrata/opetella kaavioiden tekemistä ja muotoilua, niin voit hyödyntää itseopiskelupakettiani kaavio.xlsx.

Keskiarvoja ryhmissä

Jos olen laskenut tunnuslukuja pivot-taulukkoon, niin voin tarkastella tunnuslukuja ryhmittäin raahaamalla ryhmittelevän muuttujan sarakeotsikoihin (Column Labels). Siistimisen jälkeen tyytyväisyys-muuttujien keskiarvot sukupuolittain näyttävät seuraavalta:

On tärkeää, että näkyvillä on n-arvo, josta nähdään kuinka monesta havainnosta keskiarvot on laskettu. Jos n-arvoissa on vaihtelua puuttuvien vastausten takia, niin riittää ilmoittaa n pienimmillään. Esimerkkimme tapauksessa n-arvoista paljastuu, että naisia ei ole aineistossa kuin 19 kpl. Näin pienen otoksen kohdalla keskiarvoihin täytyy suhtautua varoen. Myös keskihajontojen esittäminen sukupuolittain voisi olla paikallaan. Keskihajonnat voi liittää omiin sarakkeisiinsa samaan taulukkoon keskiarvojen kanssa, mutta tämä luonnollisesti heikentää taulukon luettavuutta. Toinen vaihtoehto on esittää keskihajonnat kokonaan omana taulukkonaan.

Jos haluan graafista havainnollistusta, niin voin käyttää pylväskaaviota:

On tärkeää katkaista arvoakseli alkamaan mielipideasteikon pienimmän arvon kohdalta (tässä 1). Myös arvoakselin otsikointiin on kiinnitettävä erityistä huomiota. Jos haluat kerrata/opetella kaavioiden tekemistä ja muotoilua, niin voit hyödyntää itseopiskelupakettiani kaavio.xlsx.

Seuraavaksi

Voin laskea tilastollisia tunnuslukuja Excelin funktioilla. Tämä on monessa mielessä jopa kätevämpää kuin tunnuslukujen laskenta pivot-taulukkoon. Lisäksi tällöin käytössäni on sellaisiakin tunnuslukuja, joita ei ole mahdollista laskea pivot-taulukkoon. Funktioiden käytöstä lisää artikkelissa 8 Tunnuslukja.