Kahden riippumattoman otoksen vertailu – lisätietoa

Päivitetty 25.4.2019.

Kahden riippumattoman otoksen t-testissä tarkastellaan kahden ryhmän keskiarvojen erotusta:

Nollahypoteesi: μ1 – μ2 = 0 (ryhmien välillä ei eroa)

Jos asiaa tutkitaan otosten avulla, niin käytännössä otoskeskiarvojen erotus on lähes aina nollasta poikkeava. Keskeinen kysymys: Milloin otoskeskiarvojen erotus poikkeaa niin paljon nollasta, että sitä ei voida selittää pelkästään otantavirheellä? Tämän selvittämiseksi tarvitaan tietoa otoskeskiarvojen erotusten jakaumasta.

Otoskeskiarvojen jakauma tiedetään. Otoskeskiarvojen jakauman keskihajonta, jota kutsutaan keskivirheeksi, arvioidaan jakamalla otoskeskihajonta otoskoon neliöjuurella. Varianssi saadaan korottamalla keskihajonta toiseen potenssiin.

Eri suurten varianssien testi

Kahden otoskeskiarvon erotusten jakauma voidaan johtaa otoskeskiarvojen jakaumista. Jakauman varianssi on otoskeskiarvojen varianssien summa. Näin saadaan otoskeskiarvojen erotuksen keskihajonnaksi elí keskivirheeksi

varianssiensumma

Neliöjuuren alla lasketaan otoskeskiarvojen jakaumien varianssit yhteen, jolloin saadaan otoskeskiarvojen erotusten jakauman varianssi. Ottamalla tästä edelleen neliöjuuri saadaan otoskeskiarvojen erotusten jakauman keskihajonta eli keskivirhe.

Voidaan osoittaa, että standardoitu keskiarvojen erotus (keskiarvojen erotus jaettuna keskivirheellä) noudattaa t-jakaumaa. Lisätietoa Studentin t-jakaumasta englanninkielisessä Wikipediassa Student’s t-distribution. T-jakauman tarkka muoto riippuu vapausasteluvusta. Tässä tapauksessa vapausasteluvun laskeminen on mutkikasta ja tuloksena ei yleensä ole edes kokonaisluku. Vapausasteluku voidaan arvioida niin kutsutulla Welch-Satterthwaiten kaavalla. Laskentakaavan löydät englanninkielisen Wikipedian artikkelista Welch’s t-test.

Yhtä suurten varianssien testi

Jos verrattavien ryhmien varianssit (ja samalla keskihajonnat) voidaan olettaa yhtäsuuriksi, niin voidaan käyttää niin kutsuttua puulattua t-testiä (yhtä suurten varianssien t-testi). Puulatussa t-testissä lasketaan puulattu keskihajonta. Puulattu keskihajonta edustaa kummankin ryhmän otoskeskiarvojen jakauman keskihajontaa. Puulattu keskihajonta lasketaan kaavalla

puulattuvarianssi

Neliöjuuren alla lasketaan puulattu varianssi vapausasteilla painotettuna keskiarvona otosvariansseista. Ottamalla tästä neliöjuuri saadaan puulattu keskihajonta.

Keskiarvojen erotusten jakauman keskihajonta eli keskivirhe saadaan edellä esitetyllä kaavalla

varianssiensumma

sijoittamalla keskihajontojen s1 ja s2 paikalle puulattu keskihajonta.

Voidaan osoittaa, että standardoitu keskiarvojen erotus (keskiarvojen erotus jaettuna keskivrheellä) noudattaa t-jakaumaa vapausastein n1+n2-2.

P-arvon ja virhemarginaalin laskeminen

Testaaminen lähtee siitä perusolettamuksesta, että nollahypoteesi pitää paikkansa. Jos nollahypoteesi pitää paikkansa, niin siitä seuraa, että standardoitu keskiarvojen erotus noudattaa t-jaukaumaa tietyllä vapausasteluvulla. Nyt voidaan laskea t-jakaumasta todennäköisyys sille että otoksista saatu keskiarvojen erotus on havaitun verran tai vielä enemmän nollasta poikkeava. Jos tämä todennäköisyys on pieni, niin tämä on ristiriidassa perusolettamuksen (nollahypoteesin) kanssa. Kyseistä todennäköisyyttä kutsutaan p-arvoksi. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea.

Keskiarvojen erotuksen virhemarginaali voidaan laskea kertomalla keskivirhe t-jakauman kriittisellä arvolla. Kriittinen arvo t on sellainen, että t-jakaumassa ollaan 95 % todennäköisyydellä rajojen -t ja t välissä ja 5 % todennäköisyydellä rajojen -t ja t ulkopuolella.

tkriittinenarvo

Excelissä 95 % luottamustasoon liittyvä t-jakauman kriittinen arvo saadaan funktiolla =TINV(5%;vapausasteluku) (suom. TJAKAUMA.KÄÄNT). Keskiarvojen erotuksen luottamusvälin alaraja saadaan vähentämällä otoskeskiarvojen erotuksesta virhemarginaali. Vastaavasti luottamusvälin yläraja saadaan lisäämällä virhemarginaali otoskeskiarvojen erotukseen.

P-arvon ja luottamusvälin välillä on suora yhteys. Jos p-arvo on pienempi kuin 5 %, niin 95 % luottamusväli ei sisällä arvoa 0. Jos p-arvo on suurempi kuin 5 %, niin 95 % luottamusväli sisältää arvon 0.

Olen laatinut Exceliin laskentapohjan otantavirhe.xlsx, jonka avulla voit helposti laskea t-testin molemmilla tavoilla (erisuuret varianssit, yhtäsuuret varianssit). Lähtötietoina laskentapohjaan annetaan molempien otosten otoskoot, keskiarvot ja keskihajonnat. Laskentapohjassa on laskentakaavat puulatulle varianssille, keskivirheille, vapausasteluvuille, t-jakauman kriittisille arvoille, virhemarginaaleille, luottamusvälien alarajoille, luottamusvälien ylärajoille, testimuuttujille ja p-arvoille.

Eri ohjelmilla voit saada erisuurten varianssien testin osalta hieman poikkeavia tuloksia vapausasteluvusta johtuen. Laskentapohjassani olen pyöristänyt vapausasteluvun alaspäin lähimpään kokonaislukuun, koska laskennassa tarvittava t-jakaumaan liittyvä Excelin funktio ei osaa huomioida desimaaleja. Tämän seurauksena virhemarginaali ja p-arvo arvioidaan joissain tapauksissa hieman yläkanttiin. Erolla ei yleensä ole käytännön merkitystä. Esimerkiksi SPSS ja Excelin T.TEST-funktio laskevat käyttäen vapausasteluvun mahdollisia desimaaleja. Excelin analyysityökalujen t-testi pyöristää vapausasteluvun ainakin joissain tapauksissa ylöspäin lähimpään kokonaislukuun.

Kumpaa testiä pitäisi käyttää?

  • Jos olet epävarma, niin käytä erisuurten varianssien testiä.
  • Jos olet varma, että ryhmien varianssit ovat likimain yhtäsuuret, niin käytä yhtäsuurten varianssien testiä.
  • Jos käytössäsi on SPSS, niin voit tehdä päätöksen Levene-testin perusteella. Lue lisää artikkelistani SPSS: Kahden riippumattoman otoksen vertailu.

Jos otokset ovat isoja ja otoskoot ovat likimain samat, niin testit antavat likimain saman tuloksen. Testien tulokset voivat poiketa paljonkin toisistaan jos otokset ovat pieniä ja/tai otoskoot poikkeavat selvästi toisistaan ja/tai otosvarianssit poikkeavat selvästi toisistaan.

Yhtäsuurten varianssien testiä (puulattu testi) käytetään paljon muiden muassa seuraavista syistä:

  • Kokeellisessa tutkimuksessa on usein hyvät perusteet olettaa ryhmien varianssit yhtäsuuriksi. Jos esimerkiksi arvotaan samasta perusjoukosta kaksi ryhmää, joista toinen saa käsittelyn ja toinen ei, niin on hyvät perusteet olettaa varianssit yhtäsuurksi molemmissa ryhmissä, koska ryhmät on alun perin arvottu samasta perusjoukosta.
  • Oppikirjoissa puulattu testi esitetään usein ykkösvaihtoehtona tai jopa ainoana vaihtoehtona. Tähän lienee historiallisia syitä. Erisuurten varianssien testin käyttö oli hankalaa ennen analysointiin tarkoitettujen tietokoneohjelmien yleistymistä. Ilman tietokonetta vapausasteiden arviointi Welch-Satterthwaiten kaavalla on vaivalloista.