4 Muuttujan arvojen luokittelu ja muuttaminen

Päivitetty 31.8.2017

Muuttujan arvojen luokittelua tai muuttamista tarvitsen esimerkiksi seuraavissa tilanteissa:

  • Haluan luokitella iän, joka on mitattu vuosina, ikäluokkiin.
  • Haluan yhdistellä mielipideasteikon vastausvaihtoehtoja esimerkiksi siten että viisiportaisesta asteikosta tulee kolmiportainen. Tämän teen yhdistämällä arvot 1 ja 2 arvoksi 1, muuttamalla arvon 3 arvoksi 2 ja yhdistämällä arvot 4 ja 5 arvoksi 3.
  • Haluan korvata mielipideasteikkoon kuulumattoman arvon (esimerkiksi viisiportaisen asteikon perässä ollut arvo 6=ei kokemusta asiasta) tekstimuotoisella tiedolla, jolloin se ei sotke keskiarvon laskentaa.
  • Haluan kääntää mielipideasteikon päin vastaiseksi. Esimerkiksi viisiportaisen asteikon voin kääntää siten, että arvosta 1 tulee arvo 5, arvosta 2 arvo 4, arvo 3 pysyy ennallaan, arvosta 4 tulee arvo 2 ja arvosta 5 tulee arvo 1.

Seuraavassa esitän neljä tapaa tehdä luokitteluita ja arvojen muuttamista Excelissä:

  • korvaaminen suoraan alkuperäiseen aineistoon Replace (Korvaa) -toimintoa käyttäen
  • korvaaminen suoraan alkuperäiseen aineistoon päälle kirjoittamalla
  • tasavälinen luokittelu pivot-taulukossa
  • epätasavälinen luokittelu pivot-taulukossa.

Ennen kuin teet muutoksia aineistoon niin huolehdi, että sinulla on varmuuskopio alkuperäisestä aineistosta kaiken varalta.

Korvaaminen suoraan alkuperäiseen aineistoon

  • Valitsen korvaamisen kohteena olevien muuttujien kaikki arvot.
  • Valitsen Home (Aloitus) -välilehdeltä Find&Select – Replace (Etsi ja valitse – Korvaa). Excel Mac: Edit – Replace.
  • Teen tarvittavat korvaukset.

Korvaaminen suoraan alkuperäiseen aineistoon päälle kirjoittamalla

  • Lajittelen (järjestä) aineiston luokiteltavan muuttujan mukaan. Lisätietoa lajittelusta artikkelissa 2 Excel Table (Taulukko).
  • Valitsen arvot, jotka haluan samaan luokkaan.
  • Kirjoitan uuden arvon ja kuittaan sen ctrl-enter -näppäinyhdistelmällä. Näppäinyhdistelmän ctrl-enter ansiosta kirjoitettu arvo menee kaikkiin valittuihin soluihin.

Tasavälinen luokittelu pivot-taulukossa

Oletan, että hallitset artikkelin 3 Taulukointi asiat, koska ilman niitä seuraavaa ei kannata lukea.

Käytän seuraavassa esimerkkiaineistoa data2.xlsx. Jos pivot-taulukoin Ikä-muuttujan siten että raahaan Ikä-muuttujan riviotsikoihin (Row Labels) ja arvoihin (Values) sekä määritän laskentamenetelmäksi Määrä (Count), niin tuloksena on pitkä taulukko. Pitkä taulukko ei ole havainnollinen esitys ikäjakaumasta. Taulukko muuttuu käyttökelpoiseksi, jos luokittelen iät sopiviin ikäluokkiin.

Valitsen yhden ja vain yhden iän pivot-taulukon riviotsikoista. Tämän jälkeen valitsen pivot-taulukkotyökaluista Analyze (Analysoi) -välilehdeltä Group Field (Ryhmän kenttä). Excel ehdottaa luokittelua, mutta voin tarvittaessa vaihtaa ehdotettua luokittelua. Viereisessä esimerkissä luokittelu aloitetaan iästä 20 ja edetään 10 vuoden luokissa niin pitkälle, että aineiston iäkkäinkin henkilö (61 vuotta) löytää luokkansa. Luokittelun jälkeen lukumäärät esittävä pivot-taulukko näyttää seuraavalta:

Voin palata luokittelun määrittelyihin myöhemmin pivot-taulukkotyökalujen Analyze (Analysoi) -välilehden Group Field (Ryhmän kenttä) -toiminnolla. Voin poistaa luokittelun Analyze (Analysoi) -välilehden Ungroup (Pura ryhmittely) -toiminnolla.

Luokittelu on voimassa myös muissa saman tiedoston pivot-taulukoissa. Jos siis olen luokitellut iän, niin ikä esiintyy luokiteltuna kaikissa saman tiedoston pivot-taulukoissa.

Luokitellun aineiston graafiseen esittämiseen sopii histogrammi. Histogrammi on pystypylväskaavio, jossa pylväät ovat kiinni toisissaan.

Jos haluat kerrata kuvioiden muotoiluun liittyviä asioita, niin voit käyttää itseopiskelupakettia kaavio.xlsx.

Epätasavälinen luokittelu pivot-taulukossa

Aina tasavälinen luokittelu ei ole se mitä tavoittelen. Esimerkiksi seuraavan taulukon tapauksessa saatan haluta yhdistää erittäin tyytymättömät (1) ja tyytymättömät (2) yhteen ryhmään samoin kuin tyytyväiset (4) ja erittäin tyytyväiset (5).

Valitsen pivot-taulukosta ne solut, jotka sisältävät 1 ja 2. Tämän jälkeen valitsen pivot-taulukkotyökalujen Analyze (Analysoi) -välilehdeltä Group Selection (Valittu ryhmä).  Pivot-taulukko voi näyttää tämän jälkeen sekavalta. Excel muodostaa arvoista 1 ja 2 ryhmän, mutta arvotkin ovat vielä näkyvillä ryhmän nimen alapuolella. Ryhmän arvot saan piiloon napsauttamalla ryhmän nimen vasemmalla puolella olevaa miinus-painiketta. Ryhmän nimen tilalle voin kirjoittaa haluamani nimen.

Vastaavalla tavalla voin valita solut, jotka sisältävät arvot 4 ja 5 ja määrittää ne ryhmäksi Analyze (Analysoi) -välilehden Group Selection (Valittu ryhmä) -toiminnolla.

Seuraavassa olen ryhmitellyt muuttujan arvot 1 ja 2 ryhmään, jolle olen kirjoittanut nimeksi ’Tyytymätön’. Olen piilottanut ryhmän jäsenet miinus-painikkeella (voin ottaa ryhmän jäsenet tarvittaessa näkyviin plus-painikkeella). Muuttujan arvon 3 tilalle olen kirjoittanut ’Ei tyytymätön eikä tyytyväinen’. Olen ryhmitellyt muuttujan arvot 4 ja 5 samaan ryhmään. En ole vielä kirjoittanut tälle ryhmälle nimeä. Excel on nimennyt ryhmän nimellä ’Group2’.

Seuraavaksi

Voin analysoida aineistoa tarkastelemalla lukumääriä ja/tai prosentteja ryhmittäin. Voin esimerkiksi tarkastella tyytyväisyyttä työtovereihin sukupuolen mukaan. Tällaista taulukointia kutsutaan ristiintaulukoinniksi. Ristiintaulukoinnista enemmän artikkelissa 5 Ristiintaulukointi.

Mainokset

7 ajatusta artikkelista “4 Muuttujan arvojen luokittelu ja muuttaminen

  1. blondi humanisti

    Aki, olet ihana ihminen. Pelastit juuri mun maanantain ja koko viikon.

    Vastaa
  2. Marja Hugg

    Olen pahasti pulassa, huhtikuusta asti pyörittänyt kolmea hypoteesia enkä saa onnistumaan ajoa? Voitko mitenkään neuvoa?
    Tutkin eri koulutussisältöjen (kolme eri koulutusta sisällöltään) vaikutusta myyntiin sekä koulutusmäärien vaikutusta myyntiin. kolme hypoteesia, ja otos on pieni 35 myyjän ryhmä 400sta. Lisäksi ikä ei ole normaalisti jakautunut. Jos tutkii myynninkeskiarvon ja neljän eri myyjäryhmän eroja, onko silloinkin huomioitava että ikä ei ole myyjien kohdalla jakautunut normaalisti vaikka ikä ei itsessään ole muuttuja siinä hypoteesissa?
    Mä olen jo tuskainen en saa mitään oikeata tulosta aikaiseksi, tai sitten en ole osannut tehdä kaikkia muuttujia oikein.
    olen enemmän kuin kiitollinen jos voit auttaa.

    mh

    Vastaa
    1. akitaanila Kirjoittaja

      Näin pienellä otoksella suosittelen Kruskal-Wallis -testiä ( https://tilastoapu.wordpress.com/2012/04/14/kruskal-wallis-testi/ ), jossa normaalijakautuneisuutta ei tarvitse olettaa.
      Jos ikä ei ole hypoteesissa esiintyvä muuttuja, niin sen normaalijakautuneisuudesta ei muutenkaan tarvitse olla huolissaan. Jos perusjoukon ikäjakauma on tiedossa, niin otoksen ikäjakaumaa kannattaa toki verrata perusjoukon ikäjakaumaan. Tämä kertoo jotain otoksen edustavuudesta.

      Vastaa
  3. Hanna

    Kiitos taas hyvästä blogista. 🙂
    Mietin spss-ohjelmaan syntymävuoden koodaamista. Minulla nyt aineistossa vastaajien syntymävuodet ilman luokittelua. Kannattaako ne luokitella eri ikäkausiin ja tehdäänkö se transform- recode into different variables vai jonkun muun toiminnon kautta?

    Vastaa
    1. akitaanila Kirjoittaja

      Suosittelen Transform – Recode into different variables toimintoa ja suosittelen pysymään syntymävuosissa, koska syntymävuosien muuttaminen ikävuosiksi aiheuttaa aina pientä virhettä.

      Vastaa
  4. Nimetön

    Mikä on helpoin tapa kääntää kielteiset asteikot myönteisiksi? -Tuomo

    Vastaa
    1. Aki Taanila Kirjoittaja

      Itse tykkään tehdä tämän laskemalla. Jos käytät SPSS:ää niin uuden muuttujan laskemisen voit tehdä Transform-Compute -toiminnolla. Jos käytät Exceliä, niin voit laskea Excelin kaavoilla uuteen sarakkeeseen. Esimerkiksi 5-portaisen asteikon kääntö sujuu vähentämällä kuutosesta alkuperäinen muuttujan arvo.

      Jos olet jo laskenut valmiiksi esimerkiksi keskiarvoja, niin keskiarvotkin voit kääntää samalla laskutoimituksella.

      Vastaa

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s