Kruskal-Wallis -testi

Päivitetty 2.5.2013

Useamman kuin kahden riippumattoman otoksen välisen eron merkitsevyyttä voin testata yksisuuntaisella varianssianalyysillä. Varianssianalyysin käyttökelpoisuus on kyseenalaista ainakin seuraavissa tapauksissa:

  • Otoskoot ovat pieniä (alle 30) eikä ole varma ovatko tarkasteltavat muuttujat normaalijakautuneet perusjoukossa.
  • Tarkasteltavat muuttujat ovat mielipideasteikollisia. Jos olen sitä mieltä, että keskiarvo ei ole sopiva tunnusluku mielipideasteikolle, niin varianssianalyysi ei tule kyseeseen.

Varianssianalyysin sijasta voin käyttää Kruskal-Wallis -testiä, jonka kohdalla ei tarvitse olettaa normaalijakautuneisuutta. Kruskal-Wallis -testi soveltuu hyvin mielipideasteikoille.

Excelissä ei ole valmista toimintoa Kruskal-Wallis -testin laskemiseen. Onneksi versiosta 18 lähtien SPSS on sisältänyt erittäin helppokäyttöisen ja havainnollisen tavan testin laskemiseen. Vaikka suorittaisitkin muut analyysit Excelissä, niin tämän testin osalta kannattaa piipahtaa SPSS:n puolella. Tämä on helppoa vaikka et olisi aiemmin SPSS:ää käyttänytkään. Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Excel-aineiston avaaminen

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Muuttujien mitta-asteikon tarkistaminen

Siirry Variable View -näkymään napsauttamalla vastaavaa välilehteä SPSS-ikkunan alareunassa. Tarkista tarkasteltavien muuttujien mitta-asteikko Measure-sarakkeesta. Jos mitta-asteikko on Nominal tai Ordinal, niin vaihda asteikoksi Scale. Ryhmittelevän muuttujan mitta-asteikon täytyy olla Nominal tai Ordinal.

Miksi tarkasteltavien muuttujien mitta-asteikon täytyy olla Scale? Testin taustaoletuksena on, että muuttuja on perimmiltään jatkuvaluonteinen. Esimerkiksi 5-portaisen tyytyväisyys-asteikon arvot eivät sellaisenaan ole jatkuvaluonteisia. Tässä kuitenkin riittää se, että oletetaan tyytyväisyys jatkuvaluonteiseksi muuttujaksi, vaikka sitä mitataankin tarkkuudella 1, 2, 3, 4, 5.

Testin suorittaminen

  • Valitse valikosta Analyze – Nonparametric Tests – Independent Samples. Avautuvan Nonparametric Tests: Two or More Independent Samples -ikkunan yläreunassa on kolme välilehteä: Objective, Fields ja Settings.
  • Valitse Objective-välilehdeltä Automatically compare distributions accross groups.
  • Valitse Fields-välilehdeltä vaihtoehto Use custom field assignments, valitse ryhmittelevä muuttuja Groups: -ruutuun ja tarkasteltavat muuttujat Test Fields: -ruutuun.
  • Napsauta Run-painiketta.

Testin tulkinta

Testin tulosteena saat havainnollisen tulostaulukon. Seuraavassa on käytetty SPSS-muotoista maku.sav -aineistoa (tallenna aineisto tietokoneellesi ja avaa se sen jälkeen SPSS-ohjelmaan). Aineistossa on muuttujina marjojen kasvualusta  (punainen, sininen ja musta) ja marjojen maku (5-portaisella asteikolla mitatttuna: 1=selvästi keskimääräistä parempi, 5=selvästi keskimääräistä huonompi).

Taulukosta löytyy testattu nollahypoteesi, testimenetelmän nimi, p-arvo ja testin johtopäätös. Johtopäätöksen kriteerinä SPSS käyttää oletusarvoisesti merkitsevyystasoa 0,05 (nollahypoteesi hylätään, jos p-arvo on alle 0,05). Merkitsevyystason voit halutessasi vaihtaa Settings-välilehden Test Options -kohdasta.

Testattavana on nollahypoteesi: Makuarvioiden jakauma on samanlainen kaikilla kasvualustoilla. Testin mukaan ainakin joidenkin kasvualustojen välillä on eroa makuarvioiden jakaumassa (p-arvo 0,008).

SPSS tarjoaa lisätietoa jos kaksoisnapsautat tulostaulukkoa. SPSS näyttää jakaumien erot havainnollisena laatikkokaaviona (boxplot).

Kaavion alapuolelle SPSS tulostaa taulukon, joka sisältää testiin liittyviä tunnuslukuja. Voit tarvita joitain näistä luvuista, jos organisaatiosi raportointiohje niin vaatii.

Kokeile myös kaavion alapuolelta valittavissa olevia erilaisia näkymiä (View). Erityisen hyödyllinen on Pairwise Comparisons -näkymä. Kruskal-Wallis -testin tulos kertoo ainoastaan sen, että joidenkin ryhmien välillä on merkitsevä ero. Pairwise Comparisons -näkymästä saat selville minkä ryhmien välillä on merkitseviä eroja.

Pairwise Comparisons

Esimerkkimme tapauksessa punaisen (0) ja mustan (2) kasvualustan välillä on merkitsevä ero.