SPSS: Kahden riippumattoman otoksen vertailu

Päivitetty 27.4.2016

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippumattoman otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippumattoman otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Mitä enemmän otosten keskiarvot poikkeavat toisistaan sitä enemmän minulla on perusteita väittää, että alkoholi vaikuttaa miesten reaktioaikaan. Pienet erot keskiarvoissa voivat selittyä otantavirheellä. Reaktioajoissa on luontaista vaihtelua miesten välillä ja on sattuman varassa minkälaisen reaktioajan omaavat miehet otoksiin satutaan valitsemaan. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö keskiarvojen ero pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippumattoman otoksen t-testin. T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että keskiarvojen ero selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Testin suorittamiseksi minun täytyy valita suoritanko yhtäsuurten vai erisuurten varianssien testin sekä suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Yhtäsuurten vai erisuurten varianssien testi?

Kahden riippumattoman otoksen t-testistä on kaksi versiota. Yhtäsuurten varianssien testi sopii tilanteisiin, joissa verrattavien ryhmien varianssit (varianssi on keskihajonnan toinen potenssi) ovat likimain yhtäsuuret. Erisuurten varianssien testiä taas voidaan käyttää tilanteisiin, joissa verrattavien ryhmien varianssien yhtäsuuruutta ei voida olettaa.

Kysymys: Mistä tiedän pitääkö käyttää yhtäsuurten vai erisuurten varianssien testiä?

Vastaus: Jos lasket testin SPSS:llä, niin SPSS laskee myös Levene-testin, jonka perusteella voit tehdä valinnan (selitän tarkemmin myöhemmin).

Jos haluat perehtyä tarkemmin yhtäsuurten ja erisuurten varianssien testien eroihin, niin lue lisätietoa.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna kumman tahansa ryhmän keskiarvo voi olla toista suurempi, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain toisen ryhmän keskiarvo voi olla suurempi tai olen yksinomaan kiinnostunut toisen ryhmän keskiarvon suuremmuudesta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa keskiarvojen tilastollisesti merkitsevä ero saavutetaan pienemmällä keskiarvojen erolla.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä.

Jos otoskoot ovat vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että tarkasteltava muuttuja on perusjoukossaan likimain normaalisti jakautunut. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa). Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Seuraavassa käytän esimerkkinä aineistoa reaktioajat.sav, joka on valmiiksi SPSS-muotoinen aineisto. Kahden riippumattoman otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Independent-Samples T Test
  • Siirrän muuttujan, jonka keskiarvoista olen kiinnostunut, Test Variable(s) -ruutuun
  • Siirrän ryhmittelevän muuttujan Grouping Variable -ruutuun (esimerkissäni alkoholi)
  • Määrittelen vertailtavat ryhmät Define Groups -painikkeella. Esimerkissäni kirjoitan 0 Group 1 -ruutuun ja 1 Group 2-ruutuun (alkoholi-muuttujan arvot ovat 0 ja 1)
  • Define Groups -ikkunasta pääsen pois Continue-painikkeella
  • Valitsen OK.

SPSS tulostaa luonnollisesti molempien ryhmien otoskoot, keskiarvot ja keskihajonnat.

Varsinaisessa testitaulukossa on ensimmäisenä Levene-testi:

Jos Levene-testin Sig. (p-arvo) on vähintään 0,050, niin voin käyttää yhtäsuurten varianssien testiä. Jos Levene-testin Sig. (p-arvo) on pienempi kuin 0,050, niin käytän eri suurten varianssien testiä. Esimerkissäni käytän yhtäsuurten varianssien testiä (Levene-testin p = 0,114).

Koska päädyin yhtä suurten varianssien testiin, niin luen riviä Equal variances assumed. Sig. (2-tailed) -sarakkeesta löydän kaksisuuntaisen testin p-arvon 0,005. Tuloksen voin raportoida esimerkiksi seuraavasti:

Alkoholia nauttineiden reaktioaikojen keskiarvo 0,237 sekuntia (keskihajonta = 0,035, n=15) poikkesi raittiiden reaktioaikojen keskiarvosta 0,205 sekuntia (keskihajonta = 0,020, n=15). Ero osoittautui riippumattomien otosten t-testillä merkitseväksi: t(28) = -3,046, p = 0,005, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(28) = -3,046.

Huomaa, että tulostaulukon oikeasta reunasta löydät keskiarvojen erotuksen luottamusvälin alarajan ja ylärajan. Esimerkin tapauksessa luen luottamusvälin alarajan ja ylärajan taulukon ylemmältä riviltä, koska päädyin käyttämään yhtä suurten varianssien testiä.

spsst3

Keskiarvojen erotuksen 95 % luottamusväli on 0,01015 – 0,01040.

Muita menetelmiä kahden riippumattoman otoksen vertailuun

Kahden riippumattoman otoksen t-testi soveltuu kokeelliseen tutkimusasetelmaan, jossa vertaillaan kahta riippumatonta otosta (kuten tämän artikkelin reaktioaika-esimerkki). Testiä voidaan käyttää myös ei-kokeellisissa tutkimusasetelmissa. Esimerkiksi kyselytutkimusainestossa voidaan verrata eläkeläisten ja työssäkäyvien TV:n katseluun käytettyä aikaa.

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?