Keskiarvo ja keskihajonta

Päivitetty 18.5.2022

Keskiarvo on jakauman keskikohtaa kuvaava tunnusluku, joka lasketaan jakamalla havaintojen summa havaintojen lukumäärällä. Jos lukusuora rinnastetaan keinulautaan, niin keskiarvo on lukusuoran piste, jolla keinulauta saadaan tasapainoon. Esimerkiksi lukujen 1, 2, 3 ja 10 keskiarvo (keinulaudan tasapainopiste) on 4.

average3

Keskiarvo yksinään ei kerro mitään havaintojen vaihtelusta keskiarvon ympärillä. Tämän vuoksi keskiarvon kaveriksi lasketaan yleensä keskihajonta, joka kuvaa arvojen keskimääräistä vaihtelua keskiarvon ympärillä. Mitä isompi keskihajonta sitä enemmän havainnoissa on vaihtelua.

Voin pilkkoa keskihajonnan laskennan useaan vaiheeseen:

  • Lasken kunkin havainnon poikkeaman keskiarvosta ja korotan poikkeaman toiseen potenssiin eli lasken poikkeaman neliön.
  • Lasken poikkeamien neliöt yhteen kaikkien havaintojen osalta. Tulosta kutsutaan neliösummaksi.
  • Jaan poikkeamien neliöiden summan havaintojen lukumäärällä (n) eli lasken keskimääräisen poikkeaman neliön. Jos kyseessä on otos laajemmasta joukosta, niin havaintojen lukumäärän sijasta käytän jakajana havaintojen lukumäärää vähennettynä yhdellä (n-1). Tämän teknisen korjauksen ansiosta saan paremman arvion laajemman joukon keskihajonnasta.
  • Edellisen vaiheen tulosta kutsutaan varianssiksi. Keskihajonta on varianssin neliöjuuri.

Excelissä voin laskea keskiarvon ja keskihajonnan funktioilla:

  • AVERAGE (KESKIARVO)
  • STDEV.S (KESKIHAJONTA.S), jos lasken keskihajonnan otoksesta (jakajana n-1)
  • STDEV.P (KESKIHAJONTA.P), jos lasken keskihajonnan perusjoukosta (jakajana n).

Voin laskea keskiarvon ja keskihajonnan myös pivot-taulukkoon.

Keskiarvoja ryhmittäin

Keskiarvot ja keskihajonnat voin laskea ryhmittäin tunnusluvut AGGREGATE (KOOSTE) -funktion avustuksella siten että tunnusluvut muuttuvat suodatusten mukana. Lisätietoa löydät artikkeliin liittyvästä Excel-työkirjasta ja videosta.

Tärkeää

Keskiarvo kuvaa hyvin jakauman keskikohtaa jos tarkasteltava muuttuja on

  • välimatka-asteikollinen (asteikko kertoo sekä havaintojen järjestyksen että havaintojen välisen etäisyyden)
  • jakaumaltaan likimain symmetrinen.

Jakauma muoto kannattaa aina tarkistaa esimerkiksi histogrammin avulla (lue Luokiteltu jakauma).

Usein kysyttyä

Miten tulkitsen keskihajonnan?

Keskihajonnasta pitäisi nähdä, onko arvojen vaihtelu keskiarvon ympärillä pientä vai suurta. Keskihajonnan tulkinta on kuitenkin vaikeaa ilman vertailukohtaa. Tulkinta onnistuu kunnolla vasta tuttujen muuttujien ja vertailukohtien myötä kuten seuraavista esimerkeistä ilmenee

  • Pullotuskoneen pullottamien pullojen sisällön määrän keskihajonta on laadunvalvonnan ottamissa otoksissa ollut yleensä likimain 0,03 desilitraa. Jos uusimmassa otoksessa keskihajonta on yllättäen 0,10 desilitraa, niin tämä viittaa pullotuskoneen toimintahäiriöön.
  • Mitattaessa mielipiteitä eri asioihin 5-portaisella mielipideasteikolla, mielipiteiden keskihajontoja voidaan vertailla toisiinsa. Suurempi keskihajonta tarkoittaa suurempaa vaihtelua vastaajien mielipiteissä. Yleensä 5-portaisen mielipideasteikon keskihajonta on melko lähellä arvoa 1.
  • Sijoittajat mittaavat pörssiosakkeiden riskiä päivätuottojen keskihajonnalla. Vuositasolle muutettu keskihajonta (sijoittajat kutsuvat sitä volatiliteetiksi) on yleensä muutamia kymmeniä prosentteja. Jos seuraat päivittäin volatilitetteja niin opit nopeasti erottamaan ison ja pienen volatiliteetin.

Miksi keskihajonta lasketaan niin kuin se lasketaan?

Keskihajonnalla/varianssilla on jatkoanalyysien kannalta hyödyllisiä matemaattisia ominaisuuksia. Keskihajonta/varianssi on tärkeä luku normaalijakaumassa, virhemarginaalien laskennassa, merkitsevyystestauksessa jne.

Lisätietoja

Tämän oppii vain tekemällä itse. Harjoittele työkirjalla  ana_tunnu.xlsx.


Kurssimateriaalin etusivulle