Onko ryhmien välinen ero tilastollisesti merkitsevä?

Päivitetty 25.10.2013.

Ryhmien vertailu on usein määrällisen tutkimuksen keskeisin tehtävä. Esimerkiksi kyselytutkimusaineiston perusteella haluan kenties verrata miehiä ja naisia, eri ikäryhmiä, erilaisen koulutuksen saaneita jne. Kokeellisessa tutkimuksessa taas vertailen koeryhmää ja vertailuryhmää tai erilaisen käsittelyn saaneita.

Jos kyseessä on laajemmasta perusjoukosta poimittu otos, niin ryhmien välillä havaitut erot eivät välttämättä tarkoita todellisia eroja perusjoukossa. Kysehän voi olla pelkästään otantavirheen aiheuttamista eroista. Tämän vuoksi tarvitsen tilastollisia testejä, joiden avulla selviää, ovatko erot tilastollisesti merkitseviä. Asianmukaisen testimenetelmän valitsemiseksi minun täytyy alkajaisiksi tietää kaksi asiaa:

  • Onko kyse toisistaan riippumattomista vai riippuvista ryhmistä? Jos et ymmärrä riippumattoman ja riippuvan eroa, niin lue artikkelini Riippumattomat vai riippuvat otokset?.
  • Onko kyse kategorisesta, mielipideasteikollisesta vai määrällisestä muuttujasta?

Riippumattomat otokset – kategorinen muuttuja

Kategorisen muuttujan ristiintaulukoin ryhmittelevän muuttujan kanssa. Testimenetelmänä käytän khiin neliö -testiä.

Riippumattomat otokset – mielipideasteikollinen muuttuja

Mielipideasteikollisen muuttujan ristiintaulukoin ryhmittelevän muuttujan kanssa. Testimenetelmänä käytän khiin neliö -testiä. Jos otoskoko on pieni, niin khiin neliö -testin käyttöedellytykset eivät välttämättä täyty. Tällöin voin yhdistää mielipideasteikon arvoja. Esimerkiksi 5-portaisesta asteikosta ”täysin eri mieltä, jokseenkin eri mieltä, ei eri eikä samaa mieltä, jokseenkin samaa mieltä, täysin samaa mieltä” voin tehdä 3-portaisen asteikon ”eri mieltä, ei eri eikä samaa mieltä, samaa mieltä”.

Monien mielestä parempi vaihtoehto testaamiseen on Mann-Whitney U -testi kahden ryhmän vertailuun tai Kruskal-Wallis -testi useamman ryhmän vertailuun. Nämä soveltuvat myös pienille otoksille. Jos käytän Mann-Whitney U -testiä tai Kruskal-Wallis -testiä, niin lasken silti ristiintaulukoinnin erojen havainnollistamiseksi.

Jos lasken mielipideasteikolle keskiarvoja, niin voin käyttää kahden riippumattoman otoksen t-testiä tai useamman ryhmän vertailuun yksisuuntaista varianssianalyysiä. Monien mielestä keskiarvojen käyttö mielipideasteikoiden kohdalla on kyseenalaista. Lue lisää artikkelistani Mielipideasteikon keskiarvo.

Riippumattomat otokset – määrällinen muuttuja

Määrälliselle muuttujalle lasken keskiarvot. Testimenetelmänä voin käyttää kahden riippumattoman otoksen t-testiä tai useamman ryhmän vertailuun yksisuuntaista varianssianalyysiä.

Erityisesti pienten otosten (n<30) kohdalla t-testin käyttäedellytykset eivät välttämättä täyty. Tällöin voin käyttää Mann-Whitney U -testiä kahden ryhmän vertailuun tai Kruskal-Wallis -testiä useamman ryhmän vertailuun.

Riippuvat otokset – kategorinen muuttuja

Jos tarkasteltavat muuttujat ovat kaksiarvoisia eli dikotomisia, niin testimenetelmäksi sopii McNemar-testi. Voin esimerkiksi testata muuttuuko henkilöiden aikomus ostaa tuottetta promootion seurauksena. Tällöin muuttujina ovat ostohalukkuus ennen promootiota (kyllä/ei) ja samojen henkilöiden ostohalukkuus promootion jälkeen.

Riippuvat otokset – mielipideasteikollinen muuttuja

Voin käyttää Wilcoxon merkittyjen sijalukujen testiä kahden ryhmän vertailuun tai Friedman-testiä useamman ryhmän vertailuun.

Jos lasken mielipideasteikolle keskiarvoja, niin voin käyttää kahden riippuvan otoksen t-testiä tai useamman ryhmän vertailuun toistomittausten varianssianalyysiä. Monien mielestä keskiarvojen käyttö mielipideasteikoiden kohdalla on kyseenalaista. Lue lisää artikkelistani Mielipideasteikon keskiarvo.

Riippuvat otokset – määrällinen muuttuja

Määrälliselle muuttujalle lasken keskiarvot. Testimenetelmänä voin käyttää kahden riippuvan otoksen t-testiä tai useamman ryhmän vertailuun toistomittausten varianssianalyysiä.

Erityisesti pienten otosten (n<30) kohdalla t-testin käyttäedellytykset eivät välttämättä täyty. Tällöin voin käyttää Wilcoxon merkittyjen sijalukujen testiä kahden ryhmän vertailuun tai Friedman-testiä useamman ryhmän vertailuun.