Avainsana-arkisto: SPSS

SPSS: Toistomittausten varianssianalyysi

Päivitetty 15.3.2013

Jos toistomittausten varianssianalyysi en sinulle entuudestaan tuntematon menetelmä, niin kannattaa lukea ensiksi artikkeli Toistomittausten varianssianalyysi.

Esimerkki. Autovalmistaja testaa automallin polttoaineen kulutusta kolmella erilaisella säädöllä (A, B ja C). Kokeessa käytetään kuutta eri kuljettajaa. Jokainen kuljettaja ajaa kerran kullakin säädöllä. Koska järjestyksellä saattaa olla vaikutusta ajotapaan, niin jokaisella kuljettajalle käytetään erilaista järjestystä (mahdolliset järjestykset ovat ABC, ACB, BAC, BCA, CAB, CBA).

Polttoaineen kulutukset olivat oheisen taulukon mukaiset.

toistomittausaineisto

SPSS ja toistomittausten varianssianalyysi

Kuten muissakin keskiarvoon perustuvissa menetelmissä, niin myös toistomittausten varianssianalyysissä tarkasteltavien muuttujien edellytetään olevan normaalijakautuneita. Isoilla otoksilla (yli 30) asiaa ei yleensä tarvitse murehtia, mutta pienillä otoksilla normaalijakautuneisuus on syytä testata. Testaamiseen voin käyttää Explore-toimintoa. Lue lisää artikkelistani SPSS: Explore. Esimerkkitapauksessamme Explore-toiminnon tuottamien normaalijakaumatestien p-arvot ovat suurempia kuin 0,05, joten normaalijakautuneisuus voidaan olettaa.

toistomittaus8

toistomittaus2

Toistomittausten varianssianalyysiä ei ole SPSS:n peruspaketissa. Toiminto on käytettävissä, jos käytössäsi on Advanced Statistics -lisäpaketti.

  • Valitse Analyze > General Linear Model > Repeated Measures…
  • Kirjoita Within-Subject Factor Name -ruutuun ryhmittelevän tekijän nimi (Säätö) ja Number of Levels -ruutuun ryhmien lukumäärä (3).
  • Napsauta Add-painiketta.
  • Kirjoita Measure name -ruutuun mitattavan ominaisuuden nimi (Kulutus).
  • Napsauta Add-painiketta.
  • Napsauta Define-painiketta, jolloin pääset Repeated Measures -ikkunaan.
  • Siirrä vasemman reunan muuttujat (A, B, C) yksi kerrallan Within-Subjects Variables -ruutuun.

toistomittaus3

Plots-painikkeen takaa kannattaa valita tulostettavaksi kuvio, josta nähdään havainollisesti eri säätöjen keskiarvot. Napsauta Plots, siirrä ryhmittelevä tekijä (Säätö) Horizontal Axis -ruutuun, napsauta Add ja napsauta Continue.

Options-painikkeen takaa kannattaa tehdä muutama asetus: 

toistomittaus4

  • Siirrä ryhmittelevä tekijä (Säätö) Display Means for -ruutuun.
  • Valitse Compare main effects.
  • Valitse Confidence interval adjustment -alasvetovalikosta haluamasi menetelmä parivertailujen laskemiseen. Parivertailujen tekemisessä on sama problematiikka kuin yksisuuntaisessa varianssianalyysissä. Jos et halua perehtyä asiaan syvällisemmin, niin voit valita alasvetovalikosta Bonferroni-korjauksen.
  • Valitse Descriptive statistics tunnuslukutaulukon tulostamiseksi.
  • Napsauta lopuksi Options-ikkunan Continue-painiketta.

Tulostaulukoiden lukeminen

Tuloksena saat häkellyttävän paljon taulukoita, joista kaikkia et luultavasti tarvitse. Seuraavassa käsitellään vain perustapauksessa tarvittavia taulukoita. Descriptive Statistics -taulukosta näet eri säätöihin liittyvien kulutusten keskiarvot ja keskihajonnat.

toistomittaus7

Toistomittausten varianssianalyysiin kuuluu olennaisena osana sfäärisyyden (sphericity) testaaminen. Yksinkertaistaen voisi todeta, että tässä testataan ryhmien välisten erojen varianssien yhtäsuuruutta. Lisätietoa saat englanninkielisen Wikipedian artikkelista Mauchly’s sphericity test.

mauchy

Jos Mauchlyn sfäärisyystestin p-arvo (Sig,) on yli 0,05, niin Tests of Within-Subjects Effects -taulukosta luetaan Sphericity Assumed -riviä. Muussa tapauksessa käytetään esimerkiksi Greenhouse-Geisser -korjattua testiä.

toistomittaus5

Jos Tests of Within-Subjects Effects -taulukon p-arvo (Sig.) on alle 0,05, niin voidaan päätellä, että vähintään yhden parin välillä on merkitsevä ero? Seuraavaksi pitää selvittää minkä parien välillä on merkitsevää eroa. Tämä selviää Pairwise Comparisons -taulukosta. Seuraavaan taulukkoon on laskettu parivertailut Bonferroni-korjausta käyttäen.

toistomittaus6

Säätöjen B (taulukossa 2) ja C (taulukossa 3) kohdalla on merkitsevä ero (p–arvo 0,007). Kulutusten erojen keskiarvon luottamusväli on 0,168 – 0,698 litraa. Muiden parien välillä ei ole merkitsevää eroa.

Analyyseihin sopivat tietokoneohjelmat

Päivitetty 11.5.2016

Analyysien onnistumiseksi on tärkeää tietää mitä haluat laskea? Jollet tiedä, niin katsele tiekarttoja.

Tilasto-ohjelmat

Tilasto-ohjelmat ovat varta vasten tilastoaineistojen analysointiin tarkoitettuja ohjelmia ja näin ollen varma valinta aineiston analysointiin. Tilastolliset testit (khiin neliö -testi, t-testit, korrelaation merkitsevyys, Mann-Whitney -testi jne.) saat vaivattomimmin tilasto-ohjelmalla. Tilasto-ohjelmista käytetyin lienee SPSS.

Pienen opettelun jälkeen SPSS on helppokäyttöinen ohjelma, jolla voit analysoida myös alunperin Excel-muotoon tallennettuja aineistoja. Graafisten esitysten laatiminen vaatii hieman enemmän opettelua.

Excel

Excelillä voit laskea yhteenvetotaulukot, ristiintaulukoinnit ja tunnusluvut. Lasketuista taulukoista saat helposti havainnollisia graafisia esityksiä. Excelissä on monipuoliset mahdollisuudet tulostaulukoiden ja graafisten esitysten muotoiluun. Tilastollisten testien laskemiseen Excel ei ole paras mahdollinen väline eikä kaikkiin testeihin edes löydy valmista toimintoa.

Jos osaat Excelin perustaidot, niin Excel on luonteva valinta perusanalyyseihin. Tilastolliset testit voit silti käydä laskemassa SPSS:n puolella, sillä Excel-muotoisen aineiston voit avata tilasto-ohjelmaan.

Maailmalla on monenlaisia Excelin sisällä toimivia apuohjelmia aineiston analysointiin. Esimerkiksi Tilastoavulla voit laskea perusanalyysit täysin ilman kaavojen ja funktioiden kirjoittamista.

Jos käytössäsi on Excel 2016 niin kannattaa tutustua sivustooni Datojen analysointi.

Webropol ja muut nettikyselyohjelmistot

Webropol ja muut vastaavat ovat nettikyselyn tekemiseen sopivia ohjelmistoja. Niiden avulla saat myös joitain analyysejä nettikyselyn vastauksista. Monipuolisuudeltaan ja joustavuudeltaan ne eivät ole tilasto-ohjelman tai Excelin veroisia. Voit hyödyntää niiden tuottamia taulukoita ja graafisia esityksiä harkintasi mukaan. Useimmissa tapauksissa nettikyselyaineisto täytyy kuitenkin tuoda Exceliin tai tilasto-ohjelmaan monipuolisempien analyysien tekemiseksi.

Pääsääntö

Pääsääntö: Käytetty tietokoneohjelma ei ole itsetarkoitus. Olennaista on, että käytät tilanteeseen sopivia menetelmiä, olet huolellinen sekä esität tulokset selkeästi ja havainnollisesti.

SPSS: Yksisuuntainen varianssianalyysi

Päivitetty 29.1.2013

Tarkastelen seuraavassa esimerkkiaineistoa, jossa on testipistemääriä neljän eri koulutusohjelman suorittaneille (8 henkilöä kussakin koulutusohjelmassa). Aineiston tarkempi kuvaus artikkelissani Yksisuuntainen varianssianalyysi.

Aluksi on syytä huomauttaa, että aineisto täytyy tallentaa alla näkyvän mukaisesti (näkyvillä vain aineiston alkuosa). Ryhmää varten oma sarake ja testattavaa muuttujaa varten oma sarake.

Jos epäilen käyttöedellytyksenä olevan normaalijakautuneisuuden toteutumista, niin voin käyttää Explore-toimintoa normaalijakautuneisuuden testaamiseen. Samalla kannattaa laatia boxplot-kaavio. Lue lisää artikkelistani SPSS: Explore.

Varianssianalyysiin pääsen valitsemalla  Analyze – Compare Means – One-Way ANOVA:

  • Määrittelyikkunassa valitsen ryhmittelevän muuttujan Factor-ruutuun (koulutusohjelma) ja riippuvan muuttujan Dependent List -ruutuun (testipistemäärä).
  • Valitsen Options-painikkeen takaa Descriptive, jotta saan ryhmien keskiarvot ja muita tunnuslukuja.
  • Valitsen Options-painikkeen takaa Homogeneity of variance test, jotta pääsen testaamaan varianssien yhtäsuuruutta.

Descriptives taulukosta löydän muiden muassa ryhmien keskiarvot ja keskihajonnat (Std. Deviation).

Test of Homogeneity of Variances -taulukosta voin tarkistaa, voinko olettaa ryhmien varianssit yhtäsuuriksi (tämähän on varianssianalyysin käyttöedellytys). Testitaulukon Sig. -sarakkeesta näen että p-arvo on 0,984, joka on suurempi kuin 0,05. Näin ollen tässä tapauksessa voin olettaa varianssit yhtä suuriksi (Levene-testin nollahypoteesina on, että varianssit ovat yhtäsuuret).

ANOVA-taulukosta löydän muiden muassa ryhmien välisen (356,042) ja ryhmien sisäisen varianssin (84,348). Sig.-sarakkeesta löydän p-arvon 0,014. Koska p-arvo on pienempi kuin 0,05, niin ryhmien välillä on merkitseviä eroja.

Parivertailut

Jos varianssianalyysin p-arvo on pienempi kuin 0,05, niin tiedän ainakin joidenkin ryhmiän välillä olevan merkitsevä ero. Jos haluan tarkemman tiedon, niin suoritan parivertailuja. Parivertailujen tekemiseen SPSS tarjoaa lukuisia menetelmiä. Löydän menetelmät varianssianalyysin määrittelyikkunan (Analyze – Compare Means – One-Way ANOVA) Post Hoc -painikkeen takaa. Jos et ole perehtynyt eri menetelmien eroihin, niin voit valita Bonferroni-menetelmän. Jos menetelmän valinta askarruttaa, niin netistä löydät loputtomasti artikkeleita ja keskustelua eri menetelmistä. Voit esimerkiksi aloittaa Wikipedian Bonferroni artikkelista.

Tuloksena saan Multiple Comparisons -taulukon. Taulukon Sig.-sarakkeesta näen minkä ryhmien välillä on merkitsevä ero.

Erot ovat merkitseviä koulutusohjelmien 1 ja 2 (p-arvo 0,037) sekä 1 ja 3 välillä (p-arvo 0,021).

SPSS: Kahden riippuvan otoksen vertailu

Päivitetty 27.4.2016

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippuvan otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippuvan otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon (samaan tulokseen päädyn, jos lasken reaktioaikojen keskiarvojen eron).

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Riippuvia otoksia voidaan kutsua myös parittaisiksi otoksiksi. Käytettyä tutkimusasetelmaa voidaan kutsua toistomittaukseksi (mittaukset toistetaan samoille henkilöille).

Mitä enemmän erojen keskiarvo poikkeaa nollasta sitä enemmän minulla on perusteita väittää, että alkoholia nauttineilla on eri suuruinen reaktioaika. Pieni poikkeama nollasta voi kuitenkin selittyä otantavirheellä. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö erojen keskiarvon poikkeama nollasta pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippuvan otoksen t-testin (myös nimitystä parittaisten otosten t-testi käytetään). T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että erojen keskiarvon poikkeama nollasta selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Testin suorittamiseksi minun täytyy valita suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna ei ole käsitystä siitä onko erojen keskiarvo positiivinen vai negatiivinen, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain tietyn merkkinen erojen keskiarvo tulee kyseeseen tai olen yksinomaan kiinnostunut tietyn merkkisestä erosta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa pienempi poikkeama riittää tilastollisesti merkitsevään testitulokseen.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä. Tällöin myös mittausten erojen keskiarvon laskeminen on mielekästä.

Jos otoskoko on vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että erot ovat likimain normaalisti jakautuneet. Jos mitattavat muuttujat voidaan olettaa normaalijakautuneiksi, niin sitä suuremmalla syyllä myös mittausten ero voidaan olettaa normaalijakautuneeksi. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa).  Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Seuraavassa käytän esimerkkinä aineistoa reaktioajatriippuvat.sav, joka on valmiiksi SPSS-muotoinen aineisto. Kahden riippuvan otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Paired-Samples T Test
  • Valitsen vertailtavan parin (ensimmäisen muuttujan valitsen normaalisti ja toisen ctrl-näppäin alhaalla. Siirrän valitun parin Paired Variables -ruutuun. Toistan menettelyn jos haluan vertailla useampia muuttujapareja.
  • OK.

Tulosteina saan taulukon, jossa on molepien ryhmien keskiarvot, otoskoot ja keskihajonnat. Toisessa taulukossa on muuttujien välinen korrelaatiokerroin. Odotettavissa on yleensä iso korrelaatiokerroin, koska muuttujien arvot vastaavat pareittain toisiaan. Esimerkissämme korrelaatiokerroin 0,885 on tilastollisesti merkitsevä (p < 0,001).

Varsinaisesta parittaisen t-testin taulukosta löydän muiden muassa parien erojen keskiarvon (0,1702) ja keskeiset testin tunnusluvut: t eli testimuuttujan arvo, df eli vapausasteiden lukumäärä ja Sig. (2-tailed) eli p-arvo. Testin tuloksen voin raportoida esimerkiksi seuraavasti:

Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025, n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023, n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,630, p < 0,001, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,630.

Huomaa, että taulukossa on myös erojen keskiarvon luottamusvälin alaraja ja yläraja. Esimerkkitapauksessa erojen keskiarvon 95 % luottamusväli on 0,01054 – 0,02350.

Mihin kahden riippuvan otoksen t-testin laskenta perustuu?

Vaikka testissä tarkastellaan kahta otosta, niin viime kädessä kyseessä on yhden keskiarvon testaaminen (erojen keskiarvo). Jos haluat tietää enemmän niin lue lisätietoa.

Muita menetelmiä kahden riippuvan otoksen vertailuun

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: Kahden riippumattoman otoksen vertailu

Päivitetty 27.4.2016

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippumattoman otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippumattoman otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Mitä enemmän otosten keskiarvot poikkeavat toisistaan sitä enemmän minulla on perusteita väittää, että alkoholi vaikuttaa miesten reaktioaikaan. Pienet erot keskiarvoissa voivat selittyä otantavirheellä. Reaktioajoissa on luontaista vaihtelua miesten välillä ja on sattuman varassa minkälaisen reaktioajan omaavat miehet otoksiin satutaan valitsemaan. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö keskiarvojen ero pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippumattoman otoksen t-testin. T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että keskiarvojen ero selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Testin suorittamiseksi minun täytyy valita suoritanko yhtäsuurten vai erisuurten varianssien testin sekä suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Yhtäsuurten vai erisuurten varianssien testi?

Kahden riippumattoman otoksen t-testistä on kaksi versiota. Yhtäsuurten varianssien testi sopii tilanteisiin, joissa verrattavien ryhmien varianssit (varianssi on keskihajonnan toinen potenssi) ovat likimain yhtäsuuret. Erisuurten varianssien testiä taas voidaan käyttää tilanteisiin, joissa verrattavien ryhmien varianssien yhtäsuuruutta ei voida olettaa.

Kysymys: Mistä tiedän pitääkö käyttää yhtäsuurten vai erisuurten varianssien testiä?

Vastaus: Jos lasket testin SPSS:llä, niin SPSS laskee myös Levene-testin, jonka perusteella voit tehdä valinnan (selitän tarkemmin myöhemmin).

Jos haluat perehtyä tarkemmin yhtäsuurten ja erisuurten varianssien testien eroihin, niin lue lisätietoa.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna kumman tahansa ryhmän keskiarvo voi olla toista suurempi, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain toisen ryhmän keskiarvo voi olla suurempi tai olen yksinomaan kiinnostunut toisen ryhmän keskiarvon suuremmuudesta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa keskiarvojen tilastollisesti merkitsevä ero saavutetaan pienemmällä keskiarvojen erolla.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä.

Jos otoskoot ovat vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että tarkasteltava muuttuja on perusjoukossaan likimain normaalisti jakautunut. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa). Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Seuraavassa käytän esimerkkinä aineistoa reaktioajat.sav, joka on valmiiksi SPSS-muotoinen aineisto. Kahden riippumattoman otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Independent-Samples T Test
  • Siirrän muuttujan, jonka keskiarvoista olen kiinnostunut, Test Variable(s) -ruutuun
  • Siirrän ryhmittelevän muuttujan Grouping Variable -ruutuun (esimerkissäni alkoholi)
  • Määrittelen vertailtavat ryhmät Define Groups -painikkeella. Esimerkissäni kirjoitan 0 Group 1 -ruutuun ja 1 Group 2-ruutuun (alkoholi-muuttujan arvot ovat 0 ja 1)
  • Define Groups -ikkunasta pääsen pois Continue-painikkeella
  • Valitsen OK.

SPSS tulostaa luonnollisesti molempien ryhmien otoskoot, keskiarvot ja keskihajonnat.

Varsinaisessa testitaulukossa on ensimmäisenä Levene-testi:

Jos Levene-testin Sig. (p-arvo) on vähintään 0,050, niin voin käyttää yhtäsuurten varianssien testiä. Jos Levene-testin Sig. (p-arvo) on pienempi kuin 0,050, niin käytän eri suurten varianssien testiä. Esimerkissäni käytän yhtäsuurten varianssien testiä (Levene-testin p = 0,114).

Koska päädyin yhtä suurten varianssien testiin, niin luen riviä Equal variances assumed. Sig. (2-tailed) -sarakkeesta löydän kaksisuuntaisen testin p-arvon 0,005. Tuloksen voin raportoida esimerkiksi seuraavasti:

Alkoholia nauttineiden reaktioaikojen keskiarvo 0,237 sekuntia (keskihajonta = 0,035, n=15) poikkesi raittiiden reaktioaikojen keskiarvosta 0,205 sekuntia (keskihajonta = 0,020, n=15). Ero osoittautui riippumattomien otosten t-testillä merkitseväksi: t(28) = -3,046, p = 0,005, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(28) = -3,046.

Huomaa, että tulostaulukon oikeasta reunasta löydät keskiarvojen erotuksen luottamusvälin alarajan ja ylärajan. Esimerkin tapauksessa luen luottamusvälin alarajan ja ylärajan taulukon ylemmältä riviltä, koska päädyin käyttämään yhtä suurten varianssien testiä.

spsst3

Keskiarvojen erotuksen 95 % luottamusväli on 0,01015 – 0,01040.

Muita menetelmiä kahden riippumattoman otoksen vertailuun

Kahden riippumattoman otoksen t-testi soveltuu kokeelliseen tutkimusasetelmaan, jossa vertaillaan kahta riippumatonta otosta (kuten tämän artikkelin reaktioaika-esimerkki). Testiä voidaan käyttää myös ei-kokeellisissa tutkimusasetelmissa. Esimerkiksi kyselytutkimusainestossa voidaan verrata eläkeläisten ja työssäkäyvien TV:n katseluun käytettyä aikaa.

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: khiin neliö -testi

Päivitetty 12.5.2016

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa khiin neliö -testin myös Excelillä. Lue lisää artikkelistani Ristiintaulukointi ja khiin neliö -testi.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Tärkeä huomautus: Tässä artikkelissa esitettävä khiin neliö -testi soveltuu käytettäväksi kahden kategorisen muuttujan tapauksessa. Jos toinen muuttujista on mielipideasteikollinen, niin Mann-Whitney U -testi (kahden ryhmän vertailu) tai Kruskal-Wallis -testi (useamman ryhmän vertailu) ovat suositeltavampia testimenetelmiä.

Jos ristiintaulukoin kaksi kategorista muuttujaa, niin tarkastelen joko muuttujien välistä riippuvuutta tai vertailen ryhmiä. On jokseenkin samantekevää puhunko riippuvuudesta vai ryhmien eroista. Kokeellisessa tutkimuksessa kuitenkin puhun mieluummin ryhmien vertailusta ja ei-kokeellisessa tutkimuksessa (esimerkiksi kyselytutkimus) riippuvuudesta. Khiin neliö -testillä testaan onko riippuvuus tai ryhmien välinen ero tilastollisesti merkitsevä.

SPSS ja khiin neliö -testi

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Käytän seuraavassa esimerkkiaineistoa PopularKids.sav, joka on valmiiksi SPSS-muotoinen. Aineiston kuvaus http://lib.stat.cmu.edu/DASL/Datafiles/PopularKids.html

Ristiintaulukoinnin ja khiin neliö -testin voin suorittaa seuraavasti:

  • Valitsen Analyze – Descriptive Statistics – Crosstabs
  • Siirrän rivi ja sarakemuuttujat paikoilleen
  • Jos haluan prosentteja, niin valitsen ne Cells -painikkeen takaa
  • Valitsen Statistics-painikkeen takaa Chi-square.

Jos lasken ristiintaulukoinnin sukupuolen (Gender) ja tavoitteen (Goals) välille, niin saan seuraavat tulosteet:

Ristiintaulukoinnista näen, että tyttöjen kohdalla on suhteessa enemmän niitä, joiden ensisijaisena tavoitteena on olla suosittu. Pojissa taas on suhteessa enenmmän niitä, joiden ensisijaisena tavoitteena on olla hyvä urheilussa. Jälkimmäisestä taulukosta luen p-arvon Asymp Sig. (2-sided) -sarakkeesta ja Pearson Chi-Square -riviltä. Tässä tapauksessa p-arvo on kolmella desimaalilla 0,000, joten sukupuolen ja tavoitteen välillä on tilastollisesti merkitsevä riippuvuus. Tuloksen voin raportoida esimerkiksi seuraavasti:

Khiin neliö -testin mukaan sukupuolen ja tavoitteen välillä on merkitsevä riippuvuus (χ2 (2) = 21,455; p < 0,001).

Edellä vapausasteluku df=2 on suluissa khiin neliö merkin χ2 perässä.

Tarkastelen vielä toisena esimerkkinä ihonvärin (Race) ja tavoitteen (Goals) välistä riippuvuutta.

Testin tuloksen voin raportoia esimerkiksi seuraavasti: Khiin neliö -testin mukaan ihonvärin ja tavoitteen välillä ei ole merkitsevää riippuvuutta (χ2 (2)  = 1,443; p = 0,486).

Testin käyttöedellytykset

On tärkeää, että tarkastan testin käyttöedellytykset testitaulukon alapuolelta. Käyttöedellytykset liittyvät niin kutsuttuihin odotettuihin lukumääriin (expected counts). Jos haluat tietää, mitä odotetulla lukumäärällä tarkoitetaan, niin lue artikkelini Ristiintaulukointi ja khiin neliö -testi. Kirjallisuudessa annetaan hieman toisistaan poikkeavia rajoja sille, milloin testaaminen muuttuu epäluotettavaksi. Monissa lähteissä esitetään seuraavat kriteerit testaamisen luotettavuudelle:

  • Taulukossa, jossa on kaksi riviä ja kaksi saraketta (2×2 taulukko) ei saa olla yhtään alle viiden (5) suuruista odotettua frekvenssiä.
  • Suuremmissa taulukoissa alle viiden (5) suuruisia odotettuja frekvenssejä saa olla viidesosa (20 %) kaikista odotetuista frekvensseistä. Alle yhden (1) suuruisia odotettuja frekvenssejä ei saa olla lainkaan.

Edellä kuvatuissa esimerkeissä käyttöedellytykset täyttyvät. Sen sijaan seuraavan testitaulukon kohdalla käyttöedellytykset eivät täyty, koska 27,8 % soluista sisältää liian pienen odotetun lukumäärän (alle 5).

Jos testin käyttöedellytykset eivät täyty, niin testaaminen voi silti olla mahdollista:

  • Jos voin luontevasti yhdistellä kategorioita, niin odotetut lukumäärät kasvavat ja testaaminen saattaa olla mahdollista.
  • Jos käytössäni on Exact Tests -lisäosa, niin voin laskea tarkan p-arvon. Tällöin minun ei tarvitse välittää odotettujen lukumäärien suuruuksista. Jos Exact Tests -lisäosa on käytössä, niin ristiintaulukoinnin määrittelyikkunassa on Exact-painike, jonka alta voin määritellä laskettavaksi Exact-testin. Tällöin luen p-arvon testitaulukon Exact Sig. (2-Sided) -sarakkeesta.

McNemar-testi

Päivitetty 26.1.2013

Kahden riippuvan otoksen McNemar-testi sopii käytettäväksi kaksiarvoisten (dikotomisten) muuttujien kanssa.

Esimerkki. Asiakkailta kysyttiin valitsisivatko he tietyn pesuainemerkin (kyllä/ei). Promootion jälkeen samoilta asiakkailta kysyttiin valitsisivatko he esitellyn pesuainemerkin. McNemar-testillä voidaan testata onko promootio saanut aikaan muutosta mielipiteissä.

Excelissä ei ole valmista toimintoa McNemar-testin laskemiseen. Onneksi versiosta 18 lähtien SPSS on sisältänyt erittäin helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Excel-aineiston avaaminen

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Käytän yllä kuvailemaani esimerkkiä. Havainnot löytyvät SPSS-muotoisesta aineistosta promootio.sav (tallenna aineisto tietokoneellesi ja avaa sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Mielipiteiden jakaumat ennen ja jälkeen promootion ovat samat. McNemar-testin p-arvo on 0,015 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa Model Viewer -ikkunassa, jos kaksoisnapsautan tulostaulukkoa.