Data-analytiikka Pythonilla

Python-ohjelmointikieli ohjelmakirjastoineen on joustava, tehokas ja ilmainen väline, jolla sujuu datan siivoaminen, kuvaileva analytiikka, selittävä analytiikka, aikasarjojen analysointi, ennakoivaan analytiikka ja koneoppimisen mallit.

Python on tällä hetkellä suosittu ohjelmointikieli:

Näin pääset alkuun

  • Asenna Anaconda
  • Käynnistä Jupyter – Anacondan mukana tuleva ohjelmointiympäristö
  • Jos haluat opetella Python-ohjelmoinnin perusteita, niin kokeile Jupyterilla Teemu Sirkiän esimerkit
  • Jos haluat aloittaa suoraan data-analytiikasta, niin kokeile Jupyterilla Datan kuvailu ja visualisointi -otsikon alta löytyviä koodiesimerkkejä. Parhaiten opit kirjoittamalla koodit itse Jupyter-notebookiin ja tekemällä siinä ohessa omia kokeiluja.
  • Github – koodiesimerkit omalle koneelle – Voit kloonata koodiesimerkkini omalle koneelle oheisen ohjeen mukaan. Katso VIDEO.

Artikkeleita

Dataframe

Dataan tutustuminen ja datan valmistelu

Datan kuvailu ja visualisointi

Kuvailun tuloksia Exceliin

Tilastollinen merkitsevyys / p-arvot

Aikasarjat

Koneoppimisen malleja