Korrelaatio

Päivitetty 23.5.2022

Hajontakaavio

Hajontakaavio eli pistekaavio eli sirontakaavio on hyvä havainnollistaja kahden määrällisen muuttujan riippuvuudelle. Käytän esimerkkinä dataa, jossa on kolme muuttujaa: opiskelijan läsnäolo lähiopetustunneilla, suoritettujen harjoitustehtävien pistemäärä ja tentin pistemäärä. Haluan selvittää onko lähiopetustunneille osallistumisella ja suoritettujen harjoitustehtävien pistemäärällä yhteyttä tentin pistemäärään.

Saan havainnollisen kuvan asiasta laatimalla hajontakaaviot. Excelissä hajontakaavio on nimeltään Scatter (Piste). Läsnäolon ja tenttipisteiden välisessä hajontakaaviossa näen lievää yhteyttä, mutta havaintopisteet ovat kuitenkin melko satunnaisesti jakautuneet.

korrelaatio1

Harjoitustehtävät sen sijaan näyttävät olevan selvässä positiivisessa yhteydessä tenttipistemäärään. Hajontakaaviossa tämä näkyy nousevana pisteparvena. Alhaiset harjoitustehtävien pistemäärät näyttävät liittyvän alhaisiin tenttipistemääriin ja korkeat harjoitustehtävien pistemäärät näyttävät liittyvän korkeisiin tenttipistemääriin.

korrelaatio2

Pearsonin korrelaatiokerroin

Pearsonin korrelaatiokerroin on tunnusluku suoraviivaisen riippuvuuden voimakkuudelle. Korrelaatiokertoimesta puhuttaessa yleensä tarkoitetaan juuri Pearsonin korrelaatiokerrointa, mutta muulla tavalla laskettavia korrelaatiokertoimiakin on olemassa. Excelissä voin laskea korrelaation CORREL (KORRELAATIO) -funktiolla. Funktion ensimmäiseksi parametriksi annan viittauksen ensimmäisen muuttujan arvoihin ja toiseksi parametriksi viittauksen toisen muuttujan arvoihin.

Korrelaatiokertoimen arvo voi olla mitä tahansa -1 ja +1 väliltä. Lähellä nollaa olevat kertoimet liittyvät tilanteisiin, joissa ei ole suoraviivaista riippuvuutta. Lähellä +1 olevat kertoimet viittaavaat positiiviseen riippuvuuteen (nouseva pisteparvi hajontakaaviossa) ja lähellä -1 olevat kertoimet viittaavat negatiiviseen riippuvuuteen (laskeva pisteparvi hajontakaaviossa).

korre

Esimerkkiaineistossa läsnäolon ja tenttipistemäärän välinen korrelaatiokerroin on 0,275 ja harjoitusten ja tenttipistemäärän välinen korrelaatiokerroin on 0,844. Korrelaatiokertoimet siis kertovat samaa kuin hajontakaaviot.

Lisätietoa

Korrelaatikertoimen tulkinta vaatii ajatustoimintaa. Lue lisää aiheesta Korrelaatiokertoimen tulkinta.


Kurssimateriaalin etusivulle