Avainsana-arkisto: SPSS

SPSS: Toistomittausten varianssianalyysi

Päivitetty 25.9.2020

Jos toistomittausten varianssianalyysi en sinulle entuudestaan tuntematon menetelmä, niin kannattaa lukea ensiksi artikkeli Toistomittausten varianssianalyysi.

Esimerkki. Autovalmistaja testaa automallin polttoaineen kulutusta kolmella erilaisella säädöllä (A, B ja C). Kokeessa käytetään kuutta eri kuljettajaa. Jokainen kuljettaja ajaa kerran kullakin säädöllä. Koska järjestyksellä saattaa olla vaikutusta ajotapaan, niin jokaisella kuljettajalle käytetään erilaista järjestystä (mahdolliset järjestykset ovat ABC, ACB, BAC, BCA, CAB, CBA).

Polttoaineen kulutukset olivat oheisen taulukon mukaiset.

toistomittausaineisto

SPSS ja toistomittausten varianssianalyysi

Kuten muissakin keskiarvoon perustuvissa menetelmissä, niin myös toistomittausten varianssianalyysissä tarkasteltavien muuttujien edellytetään olevan normaalijakautuneita. Isoilla otoksilla (yli 30) asiaa ei yleensä tarvitse murehtia, mutta pienillä otoksilla normaalijakautuneisuus on syytä testata. Testaamiseen voin käyttää Explore-toimintoa. Lue lisää artikkelistani SPSS: Explore. Esimerkkitapauksessamme Explore-toiminnon tuottamien normaalijakaumatestien p-arvot ovat suurempia kuin 0,05, joten normaalijakautuneisuus voidaan olettaa.

toistomittaus8

toistomittaus2

Toistomittausten varianssianalyysiä ei ole SPSS:n peruspaketissa. Toiminto on käytettävissä, jos käytössäsi on Advanced Statistics -lisäpaketti.

  • Valitse Analyze > General Linear Model > Repeated Measures…
  • Kirjoita Within-Subject Factor Name -ruutuun ryhmittelevän tekijän nimi (Säätö) ja Number of Levels -ruutuun ryhmien lukumäärä (3).
  • Napsauta Add-painiketta.
  • Kirjoita Measure name -ruutuun mitattavan ominaisuuden nimi (Kulutus).
  • Napsauta Add-painiketta.
  • Napsauta Define-painiketta, jolloin pääset Repeated Measures -ikkunaan.
  • Siirrä vasemman reunan muuttujat (A, B, C) yksi kerrallan Within-Subjects Variables -ruutuun.

toistomittaus3

Plots-painikkeen takaa kannattaa valita tulostettavaksi kuvio, josta nähdään havainollisesti eri säätöjen keskiarvot. Napsauta Plots, siirrä ryhmittelevä tekijä (Säätö) Horizontal Axis -ruutuun, napsauta Add ja napsauta Continue.

Options-painikkeen takaa kannattaa tehdä muutama asetus: 

toistomittaus4

  • Siirrä ryhmittelevä tekijä (Säätö) Display Means for -ruutuun.
  • Valitse Compare main effects.
  • Valitse Confidence interval adjustment -alasvetovalikosta haluamasi menetelmä parivertailujen laskemiseen. Parivertailujen tekemisessä on sama problematiikka kuin yksisuuntaisessa varianssianalyysissä. Jos et halua perehtyä asiaan syvällisemmin, niin voit valita alasvetovalikosta Bonferroni-korjauksen.
  • Valitse Descriptive statistics tunnuslukutaulukon tulostamiseksi.
  • Napsauta lopuksi Options-ikkunan Continue-painiketta.

Tulostaulukoiden lukeminen

Tuloksena saat häkellyttävän paljon taulukoita, joista kaikkia et luultavasti tarvitse. Seuraavassa käsitellään vain perustapauksessa tarvittavia taulukoita. Descriptive Statistics -taulukosta näet eri säätöihin liittyvien kulutusten keskiarvot ja keskihajonnat.

toistomittaus7

Toistomittausten varianssianalyysiin kuuluu olennaisena osana sfäärisyyden (sphericity) testaaminen. Yksinkertaistaen voisi todeta, että tässä testataan ryhmien välisten erojen varianssien yhtäsuuruutta. Lisätietoa saat englanninkielisen Wikipedian artikkelista Mauchly’s sphericity test.

mauchy

Jos Mauchlyn sfäärisyystestin p-arvo (Sig,) on yli 0,05, niin Tests of Within-Subjects Effects -taulukosta luetaan Sphericity Assumed -riviä. Muussa tapauksessa käytetään esimerkiksi Greenhouse-Geisser -korjattua testiä.

toistomittaus5

Jos Tests of Within-Subjects Effects -taulukon p-arvo (Sig.) on alle 0,05, niin voidaan päätellä, että vähintään yhden parin välillä on merkitsevä ero? Seuraavaksi pitää selvittää minkä parien välillä on merkitsevää eroa. Tämä selviää Pairwise Comparisons -taulukosta. Seuraavaan taulukkoon on laskettu parivertailut Bonferroni-korjausta käyttäen.

toistomittaus6

Säätöjen B (taulukossa 2) ja C (taulukossa 3) kohdalla on merkitsevä ero (p–arvo 0,007). Kulutusten erojen keskiarvon luottamusväli on 0,168 – 0,698 litraa. Muiden parien välillä ei ole merkitsevää eroa.

Analyyseihin sopivat tietokoneohjelmat

Päivitetty 8.11.2019.

Analyysien onnistumiseksi on tärkeää tietää mitä haluat laskea? Jollet tiedä, niin katsele tiekarttoja.

Excel

Excelillä voit laskea lukumäärä- ja prosenttiyhteenvedot, ristiintaulukoinnit sekä tilastolliset tunnusluvut. Lasketuista taulukoista saat helposti havainnollisia graafisia esityksiä. Excelissä on monipuoliset mahdollisuudet tulostaulukoiden ja graafisten esitysten muotoiluun. Tilastollisen merkitsevyyden testaamiseen Excel ei ole paras mahdollinen väline eikä kaikkiin tapauksiin löydy valmista toimintoa.

Jos osaat Excelin perustaidot, niin Excel on luonteva valinta perusanalyyseihin. Tilastollisen merkitsevyyden testaukseen voit käyttää esimerkiksi Pythonia tai SPSS:ää. Excel-muotoon tallennettu data aukeaa Pythonilla tai SPSS:llä.

Python

Jos et karsasta koodaamista, niin kannattaa opetella analysoimaan Python-ohjelmointikielellä. Aikaisempaa ohjelmointi/koodaus-kokemusta et tarvitse. Python  ohjelmakirjastoineen on joustava, tehokas ja ilmainen väline datojen analysointiin, p-arvojen laskentaan ja visualisointiin.

Python sopii erinomaisesti myös koneoppimisen malleihin ja ennakoivaan analytiikkaan.

Lue lisää:

Tilasto-ohjelmat

Tilasto-ohjelmat ovat varta vasten tilastoaineistojen analysointiin tarkoitettuja ohjelmia ja näin ollen varma valinta datan analysointiin. Tilastollisen merkitsevyyden testaus (khiin neliö -testi, t-testit, korrelaation merkitsevyys, Mann-Whitney -testi jne.) sujuu tilasto-ohjelmalla helposti. Tilasto-ohjelmista käytetyimpiä on SPSS.

Pienen opettelun jälkeen SPSS on helppokäyttöinen ohjelma, jolla voit analysoida myös alunperin Excel-muotoon tallennettuja datoja. Graafisten esitysten laatiminen vaatii hieman enemmän opettelua.

Lisätietoa SPSS-tilastohjelmasta.

Nettikyselyohjelmistot

Webropol, SurveyMonkey, Questback ja muut vastaavat ovat nettikyselyn tekemiseen sopivia ohjelmistoja. Niiden avulla saat myös joitain analyysejä nettikyselyn vastauksista. Monipuolisuudeltaan ja joustavuudeltaan ne eivät ole Excelin, Pythonin tai SPSS:n veroisia. Voit hyödyntää niiden tuottamia taulukoita ja graafisia esityksiä harkintasi mukaan. Useimmissa tapauksissa nettikyselyn raakadata täytyy kuitenkin tuoda Exceliin, Pythoniin tai tilasto-ohjelmaan monipuolisempien analyysien tekemiseksi.

Lisätietoa Webropolista.

Pääsääntö

Pääsääntö: Käytetty tietokoneohjelma ei ole itsetarkoitus. Olennaista on, että käytät tilanteeseen sopivia menetelmiä, olet huolellinen sekä esität tulokset selkeästi ja havainnollisesti.

SPSS: Yksisuuntainen varianssianalyysi

Päivitetty 25.9.2020

Tarkastelen seuraavassa esimerkkidataa, jossa on testipistemääriä neljän eri koulutusohjelman suorittaneille (8 henkilöä kussakin koulutusohjelmassa). Datan tarkempi kuvaus artikkelissani Yksisuuntainen varianssianalyysi.

Aluksi on syytä huomauttaa, että data täytyy tallentaa alla näkyvän mukaisesti (näkyvillä vain aineiston alkuosa). Ryhmää varten oma sarake ja testattavaa muuttujaa varten oma sarake.

Jos epäilen käyttöedellytyksenä olevan normaalijakautuneisuuden toteutumista, niin voin käyttää Explore-toimintoa normaalijakautuneisuuden testaamiseen. Samalla kannattaa laatia boxplot-kaavio. Lue lisää artikkelistani SPSS: Explore.

Varianssianalyysiin pääsen valitsemalla  Analyze – Compare Means – One-Way ANOVA:

  • Määrittelyikkunassa valitsen ryhmittelevän muuttujan Factor-ruutuun (koulutusohjelma) ja riippuvan muuttujan Dependent List -ruutuun (testipistemäärä).
  • Valitsen Options-painikkeen takaa Descriptive, jotta saan ryhmien keskiarvot ja muita tunnuslukuja.
  • Valitsen Options-painikkeen takaa Homogeneity of variance test, jotta pääsen testaamaan varianssien yhtäsuuruutta.

Descriptives taulukosta löydän muiden muassa ryhmien keskiarvot ja keskihajonnat (Std. Deviation).

Test of Homogeneity of Variances -taulukosta voin tarkistaa, voinko olettaa ryhmien varianssit yhtäsuuriksi (tämähän on varianssianalyysin käyttöedellytys). Testitaulukon Sig. -sarakkeesta näen että p-arvo on 0,984, joka on suurempi kuin 0,05. Näin ollen tässä tapauksessa voin olettaa varianssit yhtä suuriksi (Levene-testin nollahypoteesina on, että varianssit ovat yhtäsuuret).

ANOVA-taulukosta löydän muiden muassa ryhmien välisen (356,042) ja ryhmien sisäisen varianssin (84,348). Sig.-sarakkeesta löydän p-arvon 0,014. Koska p-arvo on pienempi kuin 0,05, niin ryhmien välillä on merkitseviä eroja.

Parivertailut

Jos varianssianalyysin p-arvo on pienempi kuin 0,05, niin tiedän ainakin joidenkin ryhmiän välillä olevan merkitsevä ero. Jos haluan tarkemman tiedon, niin suoritan parivertailuja. Parivertailujen tekemiseen SPSS tarjoaa lukuisia menetelmiä. Löydän menetelmät varianssianalyysin määrittelyikkunan (Analyze – Compare Means – One-Way ANOVA) Post Hoc -painikkeen takaa. Jos et ole perehtynyt eri menetelmien eroihin, niin voit valita Bonferroni-menetelmän. Jos menetelmän valinta askarruttaa, niin netistä löydät loputtomasti artikkeleita ja keskustelua eri menetelmistä. Voit esimerkiksi aloittaa Wikipedian Bonferroni artikkelista.

Tuloksena saan Multiple Comparisons -taulukon. Taulukon Sig.-sarakkeesta näen minkä ryhmien välillä on merkitsevä ero.

Erot ovat merkitseviä koulutusohjelmien 1 ja 2 (p-arvo 0,037) sekä 1 ja 3 välillä (p-arvo 0,021).

SPSS: Kahden riippuvan otoksen vertailu

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippuvan otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippuvan otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon (samaan tulokseen päädyn, jos lasken reaktioaikojen keskiarvojen eron).

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Riippuvia otoksia voidaan kutsua myös parittaisiksi otoksiksi. Käytettyä tutkimusasetelmaa voidaan kutsua toistomittaukseksi (mittaukset toistetaan samoille henkilöille).

Mitä enemmän erojen keskiarvo poikkeaa nollasta sitä enemmän minulla on perusteita väittää, että alkoholia nauttineilla on eri suuruinen reaktioaika. Pieni poikkeama nollasta voi kuitenkin selittyä otantavirheellä. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö erojen keskiarvon poikkeama nollasta pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippuvan otoksen t-testin (myös nimitystä parittaisten otosten t-testi käytetään). T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että erojen keskiarvon poikkeama nollasta selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Testin suorittamiseksi minun täytyy valita suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna ei ole käsitystä siitä onko erojen keskiarvo positiivinen vai negatiivinen, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain tietyn merkkinen erojen keskiarvo tulee kyseeseen tai olen yksinomaan kiinnostunut tietyn merkkisestä erosta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa pienempi poikkeama riittää tilastollisesti merkitsevään testitulokseen.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä. Tällöin myös mittausten erojen keskiarvon laskeminen on mielekästä.

Jos otoskoko on vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että erot ovat likimain normaalisti jakautuneet. Jos mitattavat muuttujat voidaan olettaa normaalijakautuneiksi, niin sitä suuremmalla syyllä myös mittausten ero voidaan olettaa normaalijakautuneeksi. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa).  Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Seuraavassa käytän esimerkkinä dataa reaktioajatriippuvat.sav, joka on valmiiksi SPSS-muotoinen data. Kahden riippuvan otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Paired-Samples T Test
  • Valitsen vertailtavan parin (ensimmäisen muuttujan valitsen normaalisti ja toisen ctrl-näppäin alhaalla. Siirrän valitun parin Paired Variables -ruutuun. Toistan menettelyn jos haluan vertailla useampia muuttujapareja.
  • OK.

Tulosteina saan taulukon, jossa on molepien ryhmien keskiarvot, otoskoot ja keskihajonnat. Toisessa taulukossa on muuttujien välinen korrelaatiokerroin. Odotettavissa on yleensä iso korrelaatiokerroin, koska muuttujien arvot vastaavat pareittain toisiaan. Esimerkissämme korrelaatiokerroin 0,885 on tilastollisesti merkitsevä (p < 0,001).

Varsinaisesta parittaisen t-testin taulukosta löydän muiden muassa parien erojen keskiarvon (0,1702) ja keskeiset testin tunnusluvut: t eli testimuuttujan arvo, df eli vapausasteiden lukumäärä ja Sig. (2-tailed) eli p-arvo. Testin tuloksen voin raportoida esimerkiksi seuraavasti:

Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025, n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023, n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,630, p < 0,001, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,630.

Huomaa, että taulukossa on myös erojen keskiarvon luottamusvälin alaraja ja yläraja. Esimerkkitapauksessa erojen keskiarvon 95 % luottamusväli on 0,01054 – 0,02350.

Mihin kahden riippuvan otoksen t-testin laskenta perustuu?

Vaikka testissä tarkastellaan kahta otosta, niin viime kädessä kyseessä on yhden keskiarvon testaaminen (erojen keskiarvo). Jos haluat tietää enemmän niin lue lisätietoa.

Muita menetelmiä kahden riippuvan otoksen vertailuun

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: Kahden riippumattoman otoksen vertailu

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippumattoman otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippumattoman otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen kaksi toisistaan riippumatonta otosta miehiä
  • ensimmäisen otoksen miehille mittaan reaktioajan ilman alkoholin vaikutusta
  • toisen otoksen miehille mittaan reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kummallekin otokselle reaktioaikojen keskiarvon.

Mitä enemmän otosten keskiarvot poikkeavat toisistaan sitä enemmän minulla on perusteita väittää, että alkoholi vaikuttaa miesten reaktioaikaan. Pienet erot keskiarvoissa voivat selittyä otantavirheellä. Reaktioajoissa on luontaista vaihtelua miesten välillä ja on sattuman varassa minkälaisen reaktioajan omaavat miehet otoksiin satutaan valitsemaan. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö keskiarvojen ero pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippumattoman otoksen t-testin. T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että keskiarvojen ero selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että keskiarvojen välinen ero on merkitsevä.

Testin suorittamiseksi minun täytyy valita suoritanko yhtäsuurten vai erisuurten varianssien testin sekä suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Yhtäsuurten vai erisuurten varianssien testi?

Kahden riippumattoman otoksen t-testistä on kaksi versiota. Yhtäsuurten varianssien testi sopii tilanteisiin, joissa verrattavien ryhmien varianssit (varianssi on keskihajonnan toinen potenssi) ovat likimain yhtäsuuret. Erisuurten varianssien testiä taas voidaan käyttää tilanteisiin, joissa verrattavien ryhmien varianssien yhtäsuuruutta ei voida olettaa.

Kysymys: Mistä tiedän pitääkö käyttää yhtäsuurten vai erisuurten varianssien testiä?

Vastaus: Jos lasket testin SPSS:llä, niin SPSS laskee myös Levene-testin, jonka perusteella voit tehdä valinnan (selitän tarkemmin myöhemmin).

Jos haluat perehtyä tarkemmin yhtäsuurten ja erisuurten varianssien testien eroihin, niin lue lisätietoa.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna kumman tahansa ryhmän keskiarvo voi olla toista suurempi, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain toisen ryhmän keskiarvo voi olla suurempi tai olen yksinomaan kiinnostunut toisen ryhmän keskiarvon suuremmuudesta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa keskiarvojen tilastollisesti merkitsevä ero saavutetaan pienemmällä keskiarvojen erolla.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä.

Jos otoskoot ovat vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että tarkasteltava muuttuja on perusjoukossaan likimain normaalisti jakautunut. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa). Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Seuraavassa käytän esimerkkinä dataa reaktioajat.sav, joka on valmiiksi SPSS-muotoinen data. Kahden riippumattoman otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Independent-Samples T Test
  • Siirrän muuttujan, jonka keskiarvoista olen kiinnostunut, Test Variable(s) -ruutuun
  • Siirrän ryhmittelevän muuttujan Grouping Variable -ruutuun (esimerkissäni alkoholi)
  • Määrittelen vertailtavat ryhmät Define Groups -painikkeella. Esimerkissäni kirjoitan 0 Group 1 -ruutuun ja 1 Group 2-ruutuun (alkoholi-muuttujan arvot ovat 0 ja 1)
  • Define Groups -ikkunasta pääsen pois Continue-painikkeella
  • Valitsen OK.

SPSS tulostaa luonnollisesti molempien ryhmien otoskoot, keskiarvot ja keskihajonnat.

Varsinaisessa testitaulukossa on ensimmäisenä Levene-testi:

Jos Levene-testin Sig. (p-arvo) on vähintään 0,050, niin voin käyttää yhtäsuurten varianssien testiä. Jos Levene-testin Sig. (p-arvo) on pienempi kuin 0,050, niin käytän eri suurten varianssien testiä. Esimerkissäni käytän yhtäsuurten varianssien testiä (Levene-testin p = 0,114).

Koska päädyin yhtä suurten varianssien testiin, niin luen riviä Equal variances assumed. Sig. (2-tailed) -sarakkeesta löydän kaksisuuntaisen testin p-arvon 0,005. Tuloksen voin raportoida esimerkiksi seuraavasti:

Alkoholia nauttineiden reaktioaikojen keskiarvo 0,237 sekuntia (keskihajonta = 0,035, n=15) poikkesi raittiiden reaktioaikojen keskiarvosta 0,205 sekuntia (keskihajonta = 0,020, n=15). Ero osoittautui riippumattomien otosten t-testillä merkitseväksi: t(28) = -3,046, p = 0,005, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(28) = -3,046.

Huomaa, että tulostaulukon oikeasta reunasta löydät keskiarvojen erotuksen luottamusvälin alarajan ja ylärajan. Esimerkin tapauksessa luen luottamusvälin alarajan ja ylärajan taulukon ylemmältä riviltä, koska päädyin käyttämään yhtä suurten varianssien testiä.

spsst3

Keskiarvojen erotuksen 95 % luottamusväli on 0,01015 – 0,01040.

Muita menetelmiä kahden riippumattoman otoksen vertailuun

Kahden riippumattoman otoksen t-testi soveltuu kokeelliseen tutkimusasetelmaan, jossa vertaillaan kahta riippumatonta otosta (kuten tämän artikkelin reaktioaika-esimerkki). Testiä voidaan käyttää myös ei-kokeellisissa tutkimusasetelmissa. Esimerkiksi kyselytutkimusainestossa voidaan verrata eläkeläisten ja työssäkäyvien TV:n katseluun käytettyä aikaa.

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?

SPSS: khiin neliö -testi

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa khiin neliö -testin myös Excelillä. Lue lisää artikkelistani Ristiintaulukointi ja khiin neliö -testi.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Tärkeä huomautus: Tässä artikkelissa esitettävä khiin neliö -testi soveltuu käytettäväksi kahden kategorisen muuttujan tapauksessa. Jos toinen muuttujista on mielipideasteikollinen, niin Mann-Whitney U -testi (kahden ryhmän vertailu) tai Kruskal-Wallis -testi (useamman ryhmän vertailu) ovat suositeltavampia testimenetelmiä.

Jos ristiintaulukoin kaksi kategorista muuttujaa, niin tarkastelen joko muuttujien välistä riippuvuutta tai vertailen ryhmiä. On jokseenkin samantekevää puhunko riippuvuudesta vai ryhmien eroista. Kokeellisessa tutkimuksessa kuitenkin puhun mieluummin ryhmien vertailusta ja ei-kokeellisessa tutkimuksessa (esimerkiksi kyselytutkimus) riippuvuudesta. Khiin neliö -testillä testaan onko riippuvuus tai ryhmien välinen ero tilastollisesti merkitsevä.

SPSS ja khiin neliö -testi

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Käytän seuraavassa esimerkkidataa PopularKids.sav, joka on valmiiksi SPSS-muotoinen. Datan kuvaus https://asta.math.aau.dk/datasets/?file=PopularKids.html

Ristiintaulukoinnin ja khiin neliö -testin voin suorittaa seuraavasti:

  • Valitsen Analyze – Descriptive Statistics – Crosstabs
  • Siirrän rivi ja sarakemuuttujat paikoilleen
  • Jos haluan prosentteja, niin valitsen ne Cells -painikkeen takaa
  • Valitsen Statistics-painikkeen takaa Chi-square.

Jos lasken ristiintaulukoinnin sukupuolen (Gender) ja tavoitteen (Goals) välille, niin saan seuraavat tulosteet:

Ristiintaulukoinnista näen, että tyttöjen kohdalla on suhteessa enemmän niitä, joiden ensisijaisena tavoitteena on olla suosittu. Pojissa taas on suhteessa enenmmän niitä, joiden ensisijaisena tavoitteena on olla hyvä urheilussa. Jälkimmäisestä taulukosta luen p-arvon Asymp Sig. (2-sided) -sarakkeesta ja Pearson Chi-Square -riviltä. Tässä tapauksessa p-arvo on kolmella desimaalilla 0,000, joten sukupuolen ja tavoitteen välillä on tilastollisesti merkitsevä riippuvuus. Tuloksen voin raportoida esimerkiksi seuraavasti:

Khiin neliö -testin mukaan sukupuolen ja tavoitteen välillä on merkitsevä riippuvuus (χ2 (2) = 21,455; p < 0,001).

Edellä vapausasteluku df=2 on suluissa khiin neliö merkin χ2 perässä.

Tarkastelen vielä toisena esimerkkinä ihonvärin (Race) ja tavoitteen (Goals) välistä riippuvuutta.

Testin tuloksen voin raportoia esimerkiksi seuraavasti: Khiin neliö -testin mukaan ihonvärin ja tavoitteen välillä ei ole merkitsevää riippuvuutta (χ2 (2)  = 1,443; p = 0,486).

Testin käyttöedellytykset

On tärkeää, että tarkastan testin käyttöedellytykset testitaulukon alapuolelta. Käyttöedellytykset liittyvät niin kutsuttuihin odotettuihin lukumääriin (expected counts). Jos haluat tietää, mitä odotetulla lukumäärällä tarkoitetaan, niin lue artikkelini Ristiintaulukointi ja khiin neliö -testi. Kirjallisuudessa annetaan hieman toisistaan poikkeavia rajoja sille, milloin testaaminen muuttuu epäluotettavaksi. Monissa lähteissä esitetään seuraavat kriteerit testaamisen luotettavuudelle:

  • Taulukossa, jossa on kaksi riviä ja kaksi saraketta (2×2 taulukko) ei saa olla yhtään alle viiden (5) suuruista odotettua frekvenssiä.
  • Suuremmissa taulukoissa alle viiden (5) suuruisia odotettuja frekvenssejä saa olla viidesosa (20 %) kaikista odotetuista frekvensseistä. Alle yhden (1) suuruisia odotettuja frekvenssejä ei saa olla lainkaan.

Edellä kuvatuissa esimerkeissä käyttöedellytykset täyttyvät. Sen sijaan seuraavan testitaulukon kohdalla käyttöedellytykset eivät täyty, koska 27,8 % soluista sisältää liian pienen odotetun lukumäärän (alle 5).

Jos testin käyttöedellytykset eivät täyty, niin testaaminen voi silti olla mahdollista:

  • Jos voin luontevasti yhdistellä kategorioita, niin odotetut lukumäärät kasvavat ja testaaminen saattaa olla mahdollista.
  • Jos käytössäni on Exact Tests -lisäosa, niin voin laskea tarkan p-arvon. Tällöin minun ei tarvitse välittää odotettujen lukumäärien suuruuksista. Jos Exact Tests -lisäosa on käytössä, niin ristiintaulukoinnin määrittelyikkunassa on Exact-painike, jonka alta voin määritellä laskettavaksi Exact-testin. Tällöin luen p-arvon testitaulukon Exact Sig. (2-Sided) -sarakkeesta.

McNemar-testi

Päivitetty 26.9.2020

Kahden riippuvan otoksen McNemar-testi sopii käytettäväksi kaksiarvoisten (dikotomisten) muuttujien kanssa.

Esimerkki. Asiakkailta kysyttiin valitsisivatko he tietyn pesuainemerkin (kyllä/ei). Promootion jälkeen samoilta asiakkailta kysyttiin valitsisivatko he esitellyn pesuainemerkin. McNemar-testillä voidaan testata onko promootio saanut aikaan muutosta mielipiteissä.

Excelissä ei ole valmista toimintoa McNemar-testin laskemiseen. Onneksi versiosta 18 lähtien SPSS on sisältänyt erittäin helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Käytän yllä kuvailemaani esimerkkiä. Havainnot löytyvät SPSS-muotoisesta datasta promootio.sav (tallenna data tietokoneellesi ja avaa sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Mielipiteiden jakaumat ennen ja jälkeen promootion ovat samat. McNemar-testin p-arvo on 0,015 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa Model Viewer -ikkunassa, jos kaksoisnapsautan tulostaulukkoa.

Kruskal-Wallis -testi

Päivitetty 26.9.2020

Useamman kuin kahden riippumattoman otoksen välisen eron merkitsevyyttä voin testata yksisuuntaisella varianssianalyysillä. Varianssianalyysin käyttökelpoisuus on kyseenalaista ainakin seuraavissa tapauksissa:

  • Otoskoot ovat pieniä (alle 30) eikä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin varianssianalyysi ei tule kyseeseen.

Varianssianalyysin sijasta voin käyttää Kruskal-Wallis -testiä, jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta. Kruskal-Wallis -testi soveltuu hyvin mielipideasteikoille.

Excelissä ei ole valmista toimintoa Kruskal-Wallis -testin laskemiseen. Onneksi SPSS sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale. Ryhmittelevän muuttujan mitta-asteikon täytyy olla Nominal tai Ordinal.

Miksi tarkasteltavien muuttujien mitta-asteikon täytyy olla Scale? Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Esimerkiksi 5-portaisen tyytyväisyys-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan tyytyväisyys jatkuvaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Independent Samples. Avautuvan Nonparametric Tests: Two or More Independent Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare distributions accross groups.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse ryhmittelevä muuttuja Groups: -ruutuun ja tarkasteltavat muuttujat Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Testin tulosteena saat havainnollisen tulostaulukon. Seuraavassa on käytetty SPSS-muotoista maku.sav -aineistoa (tallenna aineisto tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan). Aineistossa on muuttujina marjojen kasvualusta  (punainen, sininen ja musta) ja marjojen maku (5-portaisella asteikolla mitatttuna: 1=selvästi keskimääräistä parempi, 5=selvästi keskimääräistä huonompi).

Taulukosta löytyy testattu nollahypoteesi, testimenetelmän nimi, p-arvo ja testin johtopäätös. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Makuarvioiden jakauma on samanlainen kaikilla kasvualustoilla. Testin mukaan ainakin joidenkin kasvualustojen välillä on eroa makuarvioiden jakaumassa (p-arvo 0,008).

SPSS tarjoaa lisätietoa jos kaksoisnapsautat tulostaulukkoa. SPSS näyttää jakaumien erot havainnollisena ruutu- ja janakaaviona (boxplot).

Kaavion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Kokeile myös kaavion alapuolelta valittavissa olevia erilaisia näkymiä (View). Erityisen hyödyllinen on Pairwise Comparisons -näkymä. Kruskal-Wallis -testin tulos kertoo ainoastaan sen, että joidenkin ryhmien välillä on merkitsevä ero. Pairwise Comparisons -näkymästä saat selville minkä ryhmien välillä on merkitseviä eroja.

Pairwise Comparisons

Esimerkkimme tapauksessa punaisen (0) ja mustan (2) kasvualustan välillä on merkitsevä ero.

Wilcoxon merkittyjen sijalukujen testi

Päivitetty 26.9.2020

Kahden riippuvan otoksen välisen eron merkitsevyyttä voin testata kahden riippuvan otoksen t-testillä. T-testin käyttökelpoisuus on kuitenkin kyseenalaista seuraavissa tapauksissa:

  • Otoskoko on pieni (alle 30) enkä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin kahden riippuvan otoksen t-testi ei tule kyseeseen.

Kahden riippuvan otoksen t-testin sijasta voin käyttää Wilcoxon merkittyjen sijalukujen testiä (Wilcoxon signed rank test), jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta.

Excelissä ei ole valmista toimintoa Wilcoxon merkittyjen sijalukujen testin laskemiseen, mutta onneksi SPSS on sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale.  Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Testi sopii siitä huolimatta myös mielipideasteikoille. Esimerkiksi 5-portaisen mielipide-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan mielipide jatkuvavaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Esimerkki. Tietokoneohjelmien testaaja halusi tutkia onko uusi ohjelma nopeampi kuin vanha. Koska tietokoneohjelmalla suoritetaan erilaisia tehtäviä, niin testaaja arpoi ohjelman tyypillisten tehtävien joukosta 10 tehtävää. Kyseiset tehtävät suoritettiin kummallakin ohjelmalla ja suoritusajat mitattiin. Mittaukset löytyvät datasta  ohjelmat.sav (tallenna data tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Uuden ja vanhan ohjelman suoritusaikojen erojen mediaani on 0. Kaksisuuntaisen Wilcoxon merkittyjen sijalukujen testin p-arvo on 0,011 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa jos kaksoisnapsautan tulostaulukkoa. SPSS näyttää parien erotukset (Uusi-Vanha) histogrammina. Esimerkin tapauksessa yhdellä parilla on positiivinen erotus (uusi ohjelma hitaampi) ja kahdeksalla parilla on negatiivinen erotus (uusi ohjelma nopeampi). Lisäksi yhdessä parissa suoritusajat ovat samat.

Kuvion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Mann-Whitney U -testi

Päivitetty 26.9.2020

Kahden riippumattoman otoksen välisen eron merkitsevyyttä voin testata kahden riippumattoman otoksen t-testillä. T-testin käyttökelpoisuus on kyseenalaista ainakin seuraavissa tapauksissa:

  • Otoskoko on pieni (alle 30) eikä olla varmoja ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olet sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin kahden riippumattoman otoksen t-testi ei tule kyseeseen.

Kahden riippumattoman otoksen t-testin sijasta voin käyttää Mann-Whitney U -testiä, jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta. Mann-Whitney U -testi soveltuu hyvin mielipideasteikoille.

Excelissä ei ole valmista toimintoa Mann-Whitney U -testin laskemiseen. Onneksi SPSS sisältää helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Excel-datan avaaminen

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale. Ryhmittelevän muuttujan mitta-asteikon täytyy olla Nominal tai Ordinal.

Miksi tarkasteltavien muuttujien mitta-asteikon täytyy olla Scale? Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Esimerkiksi 5-portaisen tyytyväisyys-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan tyytyväisyys jatkuvaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Independent Samples. Avautuvan Nonparametric Tests: Two or More Independent Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare distributions accross groups.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse ryhmittelevä muuttuja Groups: -ruutuun ja tarkasteltavat muuttujat Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Seuraavassa on testattu data1.xlsx -aineistolle miesten ja naisten tyytyväisyyksien eroja (avatessasi aineistoa SPSS:llä valitse Worksheet-asetukseksi Data). Ryhmittelevänä muuttujana (Groups) on ’Sukupuoli’ ja testattavina muuttujina (Testi Fields) ’Tyytyväisyys johtoon’, ’Tyytyväisyys työtovereihin’ jne. Testin tulosteena saat havainnollisen tulostaulukon.Taulukosta löytyy kullekin muuttujalle testattu nollahypoteesi, testimenetelmän nimi, p-arvo ja testin johtopäätös. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Tarkasteltavan muuttujan jakauma on sama molemmissa ryhmissä. Esimerkiksi muuttujan ”Tyytyväisyys johtoon” tapauksessa miesten ja naisten mielipidejakaumien välillä on merkitsevä ero (kaksisuuntaisen Mann-Whitney U -testin p-arvo=0,003). SPSS tarjoaa lisätietoa jos kaksoisnapsautat tulostaulukkoa. SPSS näyttää jakaumien eron havainnollisena kuviona:

Kuvion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Mitä Mann-Whitney U -testillä itse asiassa testataan?

Kirjallisuudessa Mann-Whitney U -testissä testattavat hypoteesit esitetään monin eri tavoin. Usein hypoteesit on muotoiltu siten, että testataan mediaanien yhtäsuuruutta. Tällöin edellytetään, että muuttujien jakaumat ovat likimain samanmuotoiset.

Mann-Whitney U -testi perustuu sijalukuihin. Tarkasteltavan muuttujan arvot laitetaan suuruusjärjestykseen ja niille annetaan suuruusjärjestykseen pohjautuvat sijaluvut. Sijalukujen summa on T=n(n+1)/2. Jos jakaumat ovat samankaltaiset, niin ryhmän sijalukujen summan pitäisi olla (n1/n)×T (ryhmän kokoa n1 vastaava osuus sijalukujen summasta T). P-arvo kertoo todennäköisyyden sille, että ryhmän sijalukujen summa poikkeaa otoksessa havaitun verran tai enemmän odotetusta, jos oletetaan nollahypoteesin pitävän paikkansa. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea.