Khiin neliö -testi – lisätietoa

Päivitetty 25.4.2019.

Tämä artikkeli sisältää lisätietoa artikkeliin 6 Ristiintaulukointi ja khiin neliö -testi.

Khiin neliö -testimuuttujan laskemiseksi tarvitaan havaitut frekvenssit ja odotetut frekvenssit. Testimuuttuja lasketaan kaavalla:

khinelio

Kaavassa i edustaa yksittäisen havainnon järjestysnumeroa ja n havaintojen kokonaismäärää. Kaavassa Oi edustaa havaittua frekvenssiä (Observed) ja Ei odotettua frekvenssiä (Expected). Khiin neliö -testimuuttujan arvo on sitä suurempi mitä enemmän havaitut frekvenssit poikkeavat odotetuista frekvensseistä. Voidaan osoittaa, että khiin neliö -testimuuttuja noudattaa likimain khiin neliö -jakaumaa vapausastein
(rivien määrä -1)×(sarakkeiden määrä -1)

Jos perusjoukossa riippuvuutta/eroa ryhmien välillä ei ole (nollahypoteesi pitää paikkansa), niin suuret khiin neliö -testimuuttujan arvot ovat epätodennäköisiä.

khijakauma

Kuvio 1. Khiin neliö -jakaumia eri vapausasteilla k (Lähde: http://en.wikipedia.org/wiki/File:Chi-square_pdf.svg)

Kannattaa katsoa KhanAcademyn havainnollinen video khiin neliö -jakauamasta.

Jakaumasta voidaan laskea todennäköisyys havaitun suuruisen tai vielä suuremman testimuuttujan arvon saamiseen. Tätä todennäköisyyttä kutsutaan p-arvoksi. Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi (perusjoukossa on riippuvuutta/eroa ryhmien välillä) saa tukea. Testi on yksisuuntainen, koska kiinnostuksen kohteena on ainoastaan jakauman oikea reuna. Testattavaa hypoteesia voidaan kuitenkin pitää kaksisuuntaisena:

Nollahypoteesi: Testimuuttujan arvo on 0
Vaihtoehtoinen hypoteesi: Testimuuttujan arvo on eri suuri kuin 0.

Testimuuttujan laskennassa toiseen potenssiin korotuksesta seuraa, että testimuuttuja on aina ei-negatiivinen. Tästä taas seuraa, että testaus onkin yksisuuntainen. Ei siis kannata hämmentyä, jos toisaalla väitetään khiin neliö -testiä aina yksisuuntaiseksi ja toisaalla taas khiin neliö -testin p-arvoa kutsutaan kaksisuuntaiseksi (esimerkiksi SPSS). Molemmissa tapauksissa on kyse täsmälleen samasta ja samalla tavalla laskettavasta testistä.

Khiin neliö -testistä voit lukea artikkelista 6 Ristiintaulukointi ja khiin neliö -testi.