Avainsana-arkisto: Toistomittaus

Toistomittausten varianssianalyysi

Päivitetty 25.4.2019.

Jos tarkoituksena on tutkia aiheuttavatko käsittelyt eroja tutkittavien ominaisuuksiin, niin keskeisimmät tutkimusasetelmat ovat:

Satunnaistettu koe (completely randomized design): Jokaista käsittelyä varten arvotaan oma ryhmä tutkittavia. Tällöin analyysimenetelmänä käytetään yksisuuntaista varianssianalyysiä.

Toistomittaus (repeated measures design): Käytetään samaa tutkittavien joukkoa eri käsittelyillä. Tätä kutsutaan toistomittaukseksi, koska samoja tutkittavia mitataan toistuvasti eri käsittelyillä. Tällöin analyysimenetelmäksi sopii toistomittausten varianssianalyysi. Esimerkiksi kolmen erilaisen moottorin säädön vaikutusta polttoaineen kulutukseen voidaan tutkia kuuden eri kuljettajan avulla siten, että kukin kuljettaja ajaa testilenkin jokaisella säädöllä. Mittaus toistetaan siis kullekin kuljettajalle 3 kertaa, mutta jokaisella kerralla on erilainen säätö.

Satunnaistettu lohkokoe (randomized block design): Jos tiedetään, että jokin tutkittavien ominaisuus vaikuttaa mittauksen kohteena oleviin muuttujiin, niin tutkittavat voidaan jakaa kyseisen ominaisuuden mukaan samanlaisiin lohkoihin. Esimerkiksi samaan pikaruokaketjuun kuuluvien neljän ravintolan eroja voidaan arvioida jakamalla arvioijat kokemuksen mukaan kuuteen eri lohkoon seuraavasti:

  • ensimmäiseen lohkoon otetaan vain kaikkein kokeneimmat arvioijat
  • toiseen lohkoon otetaan hieman vähemmän kokeneet arvioijat jne.
  • kuudenteen lohkoon otetaan kaikkein vähiten kokemusta omaavat arvioijat
  • kuhunkin lohkoon otetaan neljä arvioijaa, koska arvoitavia ravintoloita on neljä
  • samaan lohkoon kuuluville neljälle arvioijalle arvotaan satunnaisesti arvioitavat ravintolat.

Asetelmalla pyritään kontrolloimaan arvioijan kokemuksen vaikutusta arvioihin. Myös tähän asetelmaan sopii analyysimenetelmäksi toistomittausten varianssianalyysi.

Yksisuuntaisen varianssinalyysin ja toistomittausten varianssianalyysin keskeinen ero

anova10Yksisuuntaisessa varianssianalyysissä mittaustulosten vaihtelu jaetaan ryhmien (kutakin käsittelyä vastaa yksi ryhmä) väliseen ja ryhmien sisäiseen vaihteluun. Kyseessä on malli, jossa pyritään selittämään vaihtelu ryhmien (käsittelyjen) eroilla ja tässä mallissa kaikki muu kuin ryhmien välinen vaihtelu on luettavissa virhevaihteluksi.

Toistomittausten varianssianalyysissä erotetaan ryhmien sisäisestä vaihtelusta lohkojen välinen vaihtelu ja muu osa ryhmien sisäisestä vaihtelusta luetaan virhevaihteluksi. Kyseessä on malli, jossa pyritään selittämään vaihtelu ryhmien eroilla ja lohkojen eroilla. Muu kuin ryhmien välinen ja lohkojen välinen vaihtelu luetaan virhevaihteluksi. Virhevaihtelu jää pienemmäksi kuin yksisuuntaisessa varianssianalyysissä, koska lohkojen välinen vaihtelu otetaan malliin mukaan.
anova11
Ryhmien välisten erojen merkitsevyyttä mitataan ryhmien välisen vaihtelun ja virhevaihtelun suhteena. Jos ryhmien vaihtelu on riittävän paljon virhevaihtelua suurempi, niin sillon ryhmien välisiä eroja voidaan pitää merkitsevinä. On siis olennaista, että käytetään mallia, jossa virhevaihtelu saadaan mahdollisimman pieneksi. Näin ollen toistomittausasetelmassa ja satunnaistetussa lohkoasetelmassa kannatta aina käyttää toistomittausten varianssianalyysiä yksinkertaisen varianssianalyysin sijasta.

Toistomittausten varianssianalyysi Excelillä

anova16

Esimerkki. Auton polttoaineen kulutusta verrattin kolmella erilaisella moottorin säädöllä A, B ja C. Testikuljettajina oli 6 kuljettajaa, jotka ajoivat arvotussa järjestyksessä testilenkin kullakin säädöllä. Mitatut kulutukset (litraa sadalla kilomertrilla) olivat oheisen taulukon mukaiset.

Excelin analyysityökalujen avulla voin laskea toistomittausten varianssianalyysin. Jos et ole aiemmin ottanut analyysityökaluja käyttöön, niin voit tehdä sen seuraavasti:

  • Valitsen File – Options (Tiedosto – Asetukset).
  • Valitsen Add Ins (Apuohjelmat) ja valitsen alhaalta Manage (Hallinta) -ruudusta Excel Add Ins (Excel-apuohjelmat).
  • Valitsen Go (Siirry).
  • Valitsen luettelosta Analysis Toolpak (Analyysityökalut) ja valitsen OK.
  • Tämän jälkeen löydän Data (Tiedot) -välilehdeltä analyysityökalut (Data Analysis).

Analyysityökaluista löydän toistomittausten varianssianalyysin nimellä Anova: Two-Factor Without Replication (Anova: kaksisuuntainen ilman toistoa). Nimitys kaivannee hieman selitystä: ’kaksisuuntainen’ viittaa siihen, että yhteisvaihtelua selitetään kahdella tekijällä, käsittelyllä ja tutkittavien/lohkojen eroilla; ’ilman toistoa’ viittaa siihen, että kullakin käsittelyn ja tutkittavan/lohkon yhdistelmällä on vain yksi mittaus.

Täytän Anova-ikkunaan syöttöalueen (Input Range). Syöttöalueeksi valitsen kaikki kulutukset sekä rivi- ja sarakeotsikot. Lisäksi määritän, että otsikot huomioidaan (Labels).

anova14

Excel tulostaa keskiarvot ja varianssit sekä ANOVA-taulukon, joka näyttää seuraavalta:

anova15

ANOVA-taulukossa vaihtelu on jaettu kolmeen osaan:

  • rivien eli tässä tapauksessa kuljettajien väliseen vaihteluun (SS=0,55205)
  • sarakkeiden eli tässä tapauksessa säätöjen väliseen vaihteluun (SS=0,573333)
  • muuhun vaihteluun eli virhevaihteluun (SS=0,196067).

Mitä suurempi säätöjen välinen vaihtelu on virhevaihteluun verrattuna, sitä merkitsevämpiä eroja säätöjen välillä on. Tämä testataan F-testillä, jonka p-arvon voin lukea taulukosta.

Esimerkin tapauksessa ainakin kahden säädön välillä on merkitsevä ero (p-arvo 0,001).

On opettavaista ainakin kerran tutustua ANOVA-taulukon johtamiseen ja erityisesti vaihtelua mittaavien neliösummien (SS, sum of squares) laskemiseen. Voit tutustua ANOVA-taulukon johtamiseen Excel-tiedoston anovakaavat.xlsx avulla. Olen laskenut tiedostoon Excelin kaavoilla kaikki ANOVA-taulukossa oleva luvut. Tiedostosta löytyy laskettu esimerkki myös satunnaistetusta lohkokokeesta.

Käyttöedellytykset

Toistomittausten varianssianalyysiä koskee sama käyttöedellytys kuin muitakin keskiarvon käyttöön perustuvia menetelmiä: otoskeskiarvojen täytyy olla peräisin likimain normaalijakaumasta. Jos ryhmät ovat isoja (vähintään 30), niin normaalijakautuneisuus ei yleensä ole ongelma. Jos ryhmät ovat pieniä, voin arvioida normaalijakautuneisuutta otoksen arvojen jakauman perusteella (histogrammi, ruutu- ja janakaavio). Epäselvissä tapauksissa kannattaa testata normaalijakautuneisuus SPSS:llä. Ohjeet laatikkokaavion tekemiseen ja normaalijakautuneisuuden testaamiseen löydät artikkelistani SPSS: Explore.

Toisena käyttöedellytyksenä on niin kutsuttu sfäärisyys (sphericity). Yksinkertaistaen voisi todeta, että tässä on kyse ryhmien välisten erojen varianssien yhtäsuuruudesta. Sfäärisyyden testaamiseen ei ole toimintoa Excelissä. Lue lisää artikkelista SPSS: Toistomittausten varianssianalyysi.

Jos käyttöedellytykset eivät täyty, niin voin käyttää SPSS:n Friedman-testiä.

Parivertailut

Varianssianalyysi kertoo onko ryhmien keskiarvojen välillä merkitseviä eroja. Sen sijaan varianssianalyysi ei kerro minkä ryhmien välillä on merkitseviä eroja. Arvailuja voin tehdä ryhmien keskiarvojen perusteella. Tarkempaan analyysiin tarvitsen parivertailuja. Excel ei tarjoa valmiita työkaluja parivertailujen tekemiseen. SPSS sisältää menetelmiä parivertailujen tekemiseen. Lue lisää artikkelista SPSS: Toistomittausten varianssianalyysi.

Toistomittausasetelma

Päivitetty 2.4.2019.

Toistomittausasetelma

Ennen tämän artikkelin lukemista on suotavaa lukea artikkelini Kokeellinen tutkimus.

Toistomittausasetelmaa kutsutaan myös riippuvien otosten asetelmaksi.

Jos tutkin alkoholin vaikutusta reaktioaikaan, niin voin toteuttaa toistomittausasetelman seuraavasti:

  • Valitsen ryhmän koehenkilöitä.
  • Mittaan reaktioajat ilman alkoholia ja samoille henkilöille alkoholin nauttimisen jälkeen.
  • Lasken kullekin koehenkilölle reaktioaikojen eron ja edelleen kaikkien koehenkilöiden erojen keskiarvon. Jos erojen keskiarvo poikkeaa merkitsevästi nollasta, niin voin pitää tätä alkoholin vaikutuksena.

Erojen keskiarvoa voin testata kahden riippuvan otoksen t-testillä.

Klassisen koeasetelman ja toistomittauksen vertailua

Toistomittausasetelmaa käyttäessäni voin käyttää pienempää tutkittavien joukkoa, koska tutkittavia ei tarvitse jakaa koeryhmään ja vertailuryhmään.

Toistomittausasetelmassa henkilöiden välinen reaktioaikojen vaihtelu ei peitä alkoholin vaikutusta samalla tavoin kuin klassisessa koeasetelmassa, koska jokaisen henkilön kohdalla reaktioaikaa (ilman alkoholia) verrataan henkilön itsensä reaktioaikaan (alkoholin vaikutuksen alaisena).

Ensimmäinen reaktioajan mittaus voi aiheuttaa oppimista, joka parantaa toisen mittauksen reaktioaikaa. Ongelman vaikutusta voin lieventää vaihtelemalla satunnaisesti järjestystä (joillekin mittaan ensin reaktioajan ilman alkoholia ja toisille alkoholin vaikutuksen alaisena). Tämä toki lisää odotusaikoja, koska alkoholin vaikutuksen poistumista täytyy odottaa melko kauan.

Klassisen koeasetelman ja toistomittausasetelman paremmuus riippuu tutkittavasta ilmiöstä ja täytyy miettiä tapauskohtaisesti.

Kategorinen muuttuja

Jos mitattava muuttuja on kategorinen, niin keskiarvojen käyttö ei tule kyseeseen. Tällöin en voi testata eron merkitsevyyttä riippuvien otosten t-testillä. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä.

SPSS: Kahden riippuvan otoksen vertailu

Päivitetty 26.9.2020

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa kahden riippuvan otoksen t-testin myös Excelillä. Lue lisää artikkelistani Kahden riippuvan otoksen vertailu.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss.pdf.

Jos haluan tutkia vaikuttaako alkoholi miesten reaktioaikaan, niin voin toimia seuraavasti:

  • valitsen otoksen miehiä
  • mittaan otoksen miehille reaktioajan ilman alkoholin vaikutusta
  • mittaan otoksen miehille reaktioajan sen jälkeen kun he ovat nauttineet tarkoin mitatun määrän alkoholia
  • lasken kullekin miehelle reaktioaikojen eron
  • lasken reaktioaikojen erojen keskiarvon (samaan tulokseen päädyn, jos lasken reaktioaikojen keskiarvojen eron).

Kumpaakin mittausta voin pitää omana otoksenaan, mutta kyseessä ovat toisistaan riippuvat otokset (kyseessähän ovat samat miehet). Riippuvia otoksia voidaan kutsua myös parittaisiksi otoksiksi. Käytettyä tutkimusasetelmaa voidaan kutsua toistomittaukseksi (mittaukset toistetaan samoille henkilöille).

Mitä enemmän erojen keskiarvo poikkeaa nollasta sitä enemmän minulla on perusteita väittää, että alkoholia nauttineilla on eri suuruinen reaktioaika. Pieni poikkeama nollasta voi kuitenkin selittyä otantavirheellä. Otantavirheen osuus on sitä pienempi mitä suurempaa otosta käytän.

Kysymys: Miten voin tietää selittyykö erojen keskiarvon poikkeama nollasta pelkästään otantavirheellä vai onko taustalla myös alkoholin vaikutus reaktioaikaan?

Vastaus: Suoritan kahden riippuvan otoksen t-testin (myös nimitystä parittaisten otosten t-testi käytetään). T-testin tuloksena saan p-arvon. P-arvo on todennäköisyys sille, että erojen keskiarvon poikkeama nollasta selittyy pelkästään otantavirheellä. Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

  • Jos p-arvo on alle 0,050, niin eroa sanotaan tilastollisesti melkein merkitseväksi.
  • Jos p-arvo on alle 0,010, niin eroa sanotaan tilastollisesti merkitseväksi.
  • Jos p-arvo on alle 0,001, niin eroa sanotaan tilastollisesti erittäin merkitseväksi.

Mitä pienempi p-arvo sitä enemmän saan tukea sille, että erojen keskiarvo poikkeaa merkitsevästi nollasta.

Testin suorittamiseksi minun täytyy valita suoritanko kaksisuuntaisen vai yksisuuntaisen testin. Lisäksi minun on syytä pohtia, onko testin suorittaminen ylipäätään luotettavaa eli täyttyvätkö testin käyttöedellytykset.

Kaksisuuntainen vai yksisuuntainen testi?

Jos etukäteen ajateltuna ei ole käsitystä siitä onko erojen keskiarvo positiivinen vai negatiivinen, niin käytän kaksisuuntaista testiä.

Jos etukäteen ajateltuna vain tietyn merkkinen erojen keskiarvo tulee kyseeseen tai olen yksinomaan kiinnostunut tietyn merkkisestä erosta, niin voin käyttää yksisuuntaista testiä. Yksisuuntaisessa testauksessa pienempi poikkeama riittää tilastollisesti merkitsevään testitulokseen.

Testin käyttöedellytykset

Ensiksi tarkasteltavan muuttujan täytyy olla sellainen, että keskiarvon laskeminen on mielekästä. Tällöin myös mittausten erojen keskiarvon laskeminen on mielekästä.

Jos otoskoko on vähintään 30, niin voin käyttää testiä. Tätä pienempien otosten tapauksessa edellytetään, että erot ovat likimain normaalisti jakautuneet. Jos mitattavat muuttujat voidaan olettaa normaalijakautuneiksi, niin sitä suuremmalla syyllä myös mittausten ero voidaan olettaa normaalijakautuneeksi. Jotkin muuttujat ovat luonnostaan sellaisia, että normaalijakautuneisuus voidaan olettaa. Reaktioaika on tällainen muuttuja (useimmat ihmisen fyysisistä ja psyykkisistä ominaisuuksista noudattavat normaalijakaumaa).  Epäselvissä tapauksissa voin testata normaalijakautuneisuutta SPSS:n Explore-toiminnolla. Tästä lisää artikkelissani SPSS: Explore.

Testin laskeminen SPSS:llä

Jos data on tallennettu Excel-muotoon artikkelini Datan tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta data löytyy.
  • OK.

Seuraavassa käytän esimerkkinä dataa reaktioajatriippuvat.sav, joka on valmiiksi SPSS-muotoinen data. Kahden riippuvan otoksen t-testin voin laskea seuraavasti:

  • Valitsen Analyze – Compare Means – Paired-Samples T Test
  • Valitsen vertailtavan parin (ensimmäisen muuttujan valitsen normaalisti ja toisen ctrl-näppäin alhaalla. Siirrän valitun parin Paired Variables -ruutuun. Toistan menettelyn jos haluan vertailla useampia muuttujapareja.
  • OK.

Tulosteina saan taulukon, jossa on molepien ryhmien keskiarvot, otoskoot ja keskihajonnat. Toisessa taulukossa on muuttujien välinen korrelaatiokerroin. Odotettavissa on yleensä iso korrelaatiokerroin, koska muuttujien arvot vastaavat pareittain toisiaan. Esimerkissämme korrelaatiokerroin 0,885 on tilastollisesti merkitsevä (p < 0,001).

Varsinaisesta parittaisen t-testin taulukosta löydän muiden muassa parien erojen keskiarvon (0,1702) ja keskeiset testin tunnusluvut: t eli testimuuttujan arvo, df eli vapausasteiden lukumäärä ja Sig. (2-tailed) eli p-arvo. Testin tuloksen voin raportoida esimerkiksi seuraavasti:

Reaktioaikojen keskiarvo ilman alkoholia 0,226 (keskihajonta = 0,025, n = 15) oli pienempi kuin keskiarvo alkoholin vaikutuksen alaisena 0,243 (keskihajonta = 0,023, n = 15). Ero osoittautui riippuvien otosten t-testillä merkitseväksi: t(14) = 5,630, p < 0,001, 2-suuntainen.

Tieteellisessä tekstissä t-testimuuttujan arvo täytyy ilmoittaa yhdessä vapausasteluvun df kanssa: t(14) = 5,630.

Huomaa, että taulukossa on myös erojen keskiarvon luottamusvälin alaraja ja yläraja. Esimerkkitapauksessa erojen keskiarvon 95 % luottamusväli on 0,01054 – 0,02350.

Mihin kahden riippuvan otoksen t-testin laskenta perustuu?

Vaikka testissä tarkastellaan kahta otosta, niin viime kädessä kyseessä on yhden keskiarvon testaaminen (erojen keskiarvo). Jos haluat tietää enemmän niin lue lisätietoa.

Muita menetelmiä kahden riippuvan otoksen vertailuun

Jos kahden riippumattoman otoksen t-testi ei tule kysymykseen, niin tarjolla on monia muita menetelmiä ryhmien välisen eron testaamiseen. Lue lisää artikkelistani Onko ryhmien välinen ero tilastollisesti merkitsevä?