P-arvo

Päivitetty 25.10.2013.

Tilastollisen testauksen logiikka vastaa monin tavoin oikeudenkäynnin logiikkaa. Oikeudenkäynnissä oletetaan, että henkilö on syytön kunnes toisin osoitetaan. Tilastollisessa testauksessa oletetaan nollahypoteesin pitävän paikkansa kunnes toisin osoitetaan. Nollahypoteesi on usein muotoa ’ei eroa’ tai  ’ei riippuvuutta’. Esimerkiksi

  • Miehet ja naiset ovat yhtä tyytyväisiä työympäristöön.
  • Tehtyjen harjoitustehtävien määrän ja tenttimenestyksen välillä ei ole riippuvuutta.
  • Miesten reaktioaika ei muutu alkoholin nauttimisen seurauksena.

Tilastollisessa testauksessa oletetaan nollahypoteesin pitävän paikkansa kunnes toisin osoitetaan.

Todistustaakka on syyttäjällä, tilastollisessa testauksessa tutkijalla. Syyttäjä kerää oikeudenkäyntiä varten todisteita syyllisyyden puolesta. Tilastollisessa testauksessa tutkija kerää otoksen kiinnostuksen kohteena olevasta perusjoukosta.

Tutkija vertaa otoksen tulosta nollahypoteesiin. Pelkästään otantavirheen takia otoksen tulos poikkeaa enemmän tai vähemmän nollahypoteesista. Isoja poikkeamia ei kuitenkaan voida selittää pelkästään otantavirheellä.  Vastaavalla tavalla syyttäjä voi esittää niin vahvoja todisteita syyllisyyden puolesta, että niitä ei voida selittää pelkästään sattumalla. Jos syytetty on tavattu ryöstön jälkeen ryöstöpaikan läheisyydestä kädessään ryöstösaalista ja toisessa kädessä ase, niin harva uskoo tämän kaiken aiheutuneen sattumalta, ilman että syytetty olisi osallinen ryöstöön.

Pelkästään otantavirheen takia otoksen tulos poikkeaa enemmän tai vähemmän nollahypoteesista. Isoja poikkeamia ei kuitenkaan voida selittää pelkästään otantavirheellä.

Tilastollisen testauksen keskeinen kysymys on: kuinka iso poikkeama nollahypoteesista on liian iso selitettäväksi pelkällä otantavirheellä? Asian selventämiseksi tutkija laskee kuinka yllättävänä otoksessa havaittua voidaan pitää, jos oletetaan nollahypoteesin pitävän paikkansa. Tätä kutsutaan p-arvoksi.

Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea ja sitä enemmän todisteet puhuvat nollahypoteesia vastaan.

Jos esimerkiksi tutkija saa p-arvoksi 0,001 eli 0,1 %, niin otoksen tulos on yllättävä. P-arvoa 0,001 on tulkittava seuraavasti: Jos nollahypoteesin oletetaan pitävän paikkansa, niin otoksen kaltainen tai vielä enemmän nollahypoteesista poikkeava tulos sattuu kohdalle yhdessä otoksessa tuhannesta. Kyseessä on siis melko yllättävä tulos. Tämä jos mikä on riittävä todiste nollahypoteesia vastaan. Tuloshan ei nimittäin olekaan enää yllättävä, jos nollahypoteesi ei pidäkään paikkansa. Seuraavassa kolme näkökulmaa p-arvon ymmärtämiseksi:

  • P-arvo on todennäköisyys sille, että otoksen tulos poikkeaa havaitun verran tai vieläkin enemmän nollahypoteesista (kun oletetaan, että nollahypoteesi pitää paikkansa).
  • P-arvo on todennäköisyys sille, että havaittu poikkeama nollahypoteesista voidaan selittää pelkästään otantavirheellä.
  • Jos nollahypoteesi päätetään hylätä, niin p-arvo ilmoittaa päätökseen liittyvän erehtymisriskin.

Mitä pienempi p-arvo sitä enemmän vaihtoehtoinen hypoteesi saa tukea ja sitä enemmän todisteet puhuvat nollahypoteesia vastaan. Kuinka pieni p-arvon sitten täytyy olla, jotta nollahypoteesi voidaan hylätä? Yleisimmin käytetty raja on 0,05 eli 5 %. Tämä on kuitenkin täysin mielivaltainen raja ja tapauskohtaista harkintaa on syytä käyttää. Kovin korkealle rajaa ei kuitenkaan voi nostaa. Tämän ymmärtää hyvin vertaamalla tilannetta oikeudenkäyntiin. Tuskin henkilöä päätetään tuomita, jos päätökseen liittyvä erehtymisriski on esimerkiksi 30 %. Oikeudenkäynnissä tilanne on käytännössä hankalampi, koska p-arvon kaltaista todennäköisyyttä ei yleensä ole laskettavissa.

On tärkeää huomata, että tilastollisessa testauksessa ei koskaan osoiteta nollahypoteesia oikeaksi. Todisteet joko riittävät nollahypoteesin hylkäämiseen tai eivät riitä. Vaikka todisteet eivät riitäkään nollahypoteesin hylkäämiseen, niin käytössä ei ole todisteita, jotka osoittaisivat nollahypoteesin oikeaksi. Vähän vastaavalla tavalla voidaan ajatella oikeudenkäynnistäkin. Vaikka todisteet eivät olekaan riittävät syyllisyyden osoittamiseksi, niin eivät ne toisaalta vastaansanomattomasti todista syytetyn syyttömyyttäkään.

On tärkeää huomata, että tilastollisessa testauksessa ei koskaan osoiteta nollahypoteesia oikeaksi.

P-arvoon viittaan artikkeleissani: