Wilcoxon merkittyjen sijalukujen testi

Päivitetty 26.1.2013

Kahden riippuvan otoksen välisen eron merkitsevyyttä voin testata kahden riippuvan otoksen t-testillä. T-testin käyttökelpoisuus on kuitenkin kyseenalaista seuraavissa tapauksissa:

  • Otoskoko on pieni (alle 30) enkä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin kahden riippuvan otoksen t-testi ei tule kyseeseen.

Kahden riippuvan otoksen t-testin sijasta voin käyttää Wilcoxon merkittyjen sijalukujen testiä (Wilcoxon signed rank test), jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta.

Excelissä ei ole valmista toimintoa Wilcoxon merkittyjen sijalukujen testin laskemiseen. Onneksi versiosta 18 lähtien SPSS on sisältänyt erittäin helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Excel-aineiston avaaminen

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale.  Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Testi sopii siitä huolimatta myös mielipideasteikoille. Esimerkiksi 5-portaisen mielipide-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan mielipide jatkuvavaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Related Samples. Avautuvan Nonparametric Tests: Two or More Related Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare observed data to hypothesized.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse tarkasteltavat kaksi muuttujaa Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Esimerkki. Tietokoneohjelmien testaaja halusi tutkia onko uusi ohjelma nopeampi kuin vanha. Koska tietokoneohjelmalla suoritetaan erilaisia tehtäviä, niin testaaja arpoi ohjelman tyypillisten tehtävien joukosta 10 tehtävää. Kyseiset tehtävät suoritettiin kummallakin ohjelmalla ja suoritusajat mitattiin. Mittaukset löytyvät aineistosta  ohjelmat.sav (tallenna aineisto tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan).

Testin tulosteena saan havainnollisen tulosteen. Tulosteesta voin lukea testatun hypoteesin, testin p-arvon ja testin johtopäätöksen. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Uuden ja vanhan ohjelman suoritusaikojen erojen mediaani on 0. Kaksisuuntaisen Wilcoxon merkittyjen sijalukujen testin p-arvo on 0,011 (<0,05), joten nollahypoteesi hylätään. SPSS tarjoaa lisätietoa jos kaksoisnapsautan tulostaulukkoa. SPSS näyttää parien erotukset (Uusi-Vanha) histogrammina. Esimerkin tapauksessa yhdellä parilla on positiivinen erotus (uusi ohjelma hitaampi) ja kahdeksalla parilla on negatiivinen erotus (uusi ohjelma nopeampi). Lisäksi yhdessä parissa suoritusajat ovat samat.

Kuvion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.