SPSS: khiin neliö -testi

Päivitetty 12.5.2016

Jos SPSS ei ole käytettävissäsi, niin voit suorittaa khiin neliö -testin myös Excelillä. Lue lisää artikkelistani Ristiintaulukointi ja khiin neliö -testi.

Jos SPSS ei ole sinulle entuudestaan tuttu, niin haluat ehkä tutustua monisteeseeni spss19.pdf.

Tärkeä huomautus: Tässä artikkelissa esitettävä khiin neliö -testi soveltuu käytettäväksi kahden kategorisen muuttujan tapauksessa. Jos toinen muuttujista on mielipideasteikollinen, niin Mann-Whitney U -testi (kahden ryhmän vertailu) tai Kruskal-Wallis -testi (useamman ryhmän vertailu) ovat suositeltavampia testimenetelmiä.

Jos ristiintaulukoin kaksi kategorista muuttujaa, niin tarkastelen joko muuttujien välistä riippuvuutta tai vertailen ryhmiä. On jokseenkin samantekevää puhunko riippuvuudesta vai ryhmien eroista. Kokeellisessa tutkimuksessa kuitenkin puhun mieluummin ryhmien vertailusta ja ei-kokeellisessa tutkimuksessa (esimerkiksi kyselytutkimus) riippuvuudesta. Khiin neliö -testillä testaan onko riippuvuus tai ryhmien välinen ero tilastollisesti merkitsevä.

SPSS ja khiin neliö -testi

Jos aineisto on tallennettu Excel-muotoon artikkelini Tilastoaineiston tallentaminen ohjeiden mukaisesti, niin voit avata sen SPSS-ohjelmaan:

  • Valitse SPSS:n käynnistyksen yhteydessä avautuvasta ikkunasta Open an existing data source ja napsauta OK. Jos olit jo ohittanut kyseisen ikkunan, niin valitse valikosta File-Open-Data.
  • Valitse avaamisen määrittelyikkunassa tiedostomuodoksi Excel.
  • Valitse avattava tiedosto.
  • Napsauta Open-painiketta, jolloin avautuu Opening Excel Data Source -valintaikkuna.
  • Valitse valintaruutu Read variable names
  • Tarkista ja vaihda tarvittaessa Worksheet ja Range -määrittelyt, jotka määrittelevät mistä taulukosta ja miltä solualueelta aineisto löytyy.
  • OK.

Käytän seuraavassa esimerkkiaineistoa PopularKids.sav, joka on valmiiksi SPSS-muotoinen. Aineiston kuvaus http://lib.stat.cmu.edu/DASL/Datafiles/PopularKids.html

Ristiintaulukoinnin ja khiin neliö -testin voin suorittaa seuraavasti:

  • Valitsen Analyze – Descriptive Statistics – Crosstabs
  • Siirrän rivi ja sarakemuuttujat paikoilleen
  • Jos haluan prosentteja, niin valitsen ne Cells -painikkeen takaa
  • Valitsen Statistics-painikkeen takaa Chi-square.

Jos lasken ristiintaulukoinnin sukupuolen (Gender) ja tavoitteen (Goals) välille, niin saan seuraavat tulosteet:

Ristiintaulukoinnista näen, että tyttöjen kohdalla on suhteessa enemmän niitä, joiden ensisijaisena tavoitteena on olla suosittu. Pojissa taas on suhteessa enenmmän niitä, joiden ensisijaisena tavoitteena on olla hyvä urheilussa. Jälkimmäisestä taulukosta luen p-arvon Asymp Sig. (2-sided) -sarakkeesta ja Pearson Chi-Square -riviltä. Tässä tapauksessa p-arvo on kolmella desimaalilla 0,000, joten sukupuolen ja tavoitteen välillä on tilastollisesti merkitsevä riippuvuus. Tuloksen voin raportoida esimerkiksi seuraavasti:

Khiin neliö -testin mukaan sukupuolen ja tavoitteen välillä on merkitsevä riippuvuus (χ2 (2) = 21,455; p < 0,001).

Edellä vapausasteluku df=2 on suluissa khiin neliö merkin χ2 perässä.

Tarkastelen vielä toisena esimerkkinä ihonvärin (Race) ja tavoitteen (Goals) välistä riippuvuutta.

Testin tuloksen voin raportoia esimerkiksi seuraavasti: Khiin neliö -testin mukaan ihonvärin ja tavoitteen välillä ei ole merkitsevää riippuvuutta (χ2 (2)  = 1,443; p = 0,486).

Testin käyttöedellytykset

On tärkeää, että tarkastan testin käyttöedellytykset testitaulukon alapuolelta. Käyttöedellytykset liittyvät niin kutsuttuihin odotettuihin lukumääriin (expected counts). Jos haluat tietää, mitä odotetulla lukumäärällä tarkoitetaan, niin lue artikkelini Ristiintaulukointi ja khiin neliö -testi. Kirjallisuudessa annetaan hieman toisistaan poikkeavia rajoja sille, milloin testaaminen muuttuu epäluotettavaksi. Monissa lähteissä esitetään seuraavat kriteerit testaamisen luotettavuudelle:

  • Taulukossa, jossa on kaksi riviä ja kaksi saraketta (2×2 taulukko) ei saa olla yhtään alle viiden (5) suuruista odotettua frekvenssiä.
  • Suuremmissa taulukoissa alle viiden (5) suuruisia odotettuja frekvenssejä saa olla viidesosa (20 %) kaikista odotetuista frekvensseistä. Alle yhden (1) suuruisia odotettuja frekvenssejä ei saa olla lainkaan.

Edellä kuvatuissa esimerkeissä käyttöedellytykset täyttyvät. Sen sijaan seuraavan testitaulukon kohdalla käyttöedellytykset eivät täyty, koska 27,8 % soluista sisältää liian pienen odotetun lukumäärän (alle 5).

Jos testin käyttöedellytykset eivät täyty, niin testaaminen voi silti olla mahdollista:

  • Jos voin luontevasti yhdistellä kategorioita, niin odotetut lukumäärät kasvavat ja testaaminen saattaa olla mahdollista.
  • Jos käytössäni on Exact Tests -lisäosa, niin voin laskea tarkan p-arvon. Tällöin minun ei tarvitse välittää odotettujen lukumäärien suuruuksista. Jos Exact Tests -lisäosa on käytössä, niin ristiintaulukoinnin määrittelyikkunassa on Exact-painike, jonka alta voin määritellä laskettavaksi Exact-testin. Tällöin luen p-arvon testitaulukon Exact Sig. (2-Sided) -sarakkeesta.
Mainokset