Asenna Anaconda tai Miniconda

Päivitetty 27.10.2022

Datojen analysointiin tarvittavat olennaiset Python-taidot voit oppia nopeasti vaikket omaisikaan aiempaa ohjelmointikokemusta.

Ensimmäiseksi tarvitset hyvän ohjelmointiympäristön. Datojen analysointia suunnittelevan kannattaa asentaa tietokoneelleen Anaconda tai Miniconda.

Anaconda

Anaconda sisältää muiden muassa

  • Python-tulkin
  • datojen analysointiin tarvittavat ohjelmakirjastot (NumPy, pandas, jne.)
  • graafiseen esittämiseen tarvittavat ohjelmakirjastot (matplotlib, seaborn jne.)
  • koneoppimisen malleihin tarvittavat ohjelmakirjastot (scikit-learn jne.)
  • Jupyter Notebookin ohjelmien kirjoittamiseen ja suorittamiseen
  • Conda-paketinhallintajärjestelmän, jolla voit asentaa ja päivittää ohjelmakirjastoja siten että kirjastojen versiot ovat keskenään yhteensopivia.

Anaconda sisältää paljon kirjastoja, joita et koskaan tarvitse. Jos haluat asentaa vain tarvitsemasi, niin asenna Anacondan sijasta Miniconda.

Löydät Anacondan Windowsille, Macille ja Linuxille osoitteesta

https://www.anaconda.com/products/distribution

Valitse oma käyttöjärjestelmäsi (Windows, macOS tai Linux) ja asenna Anaconda oletusasetuksilla.

Ohjeita Anacondan käyttöön löydät osoitteesta

https://docs.anaconda.com/anaconda/

Miniconda

Miniconda on Anacondan riisuttu versio, johon itse asennat tarvitsemasi kirjastot Conda-paketinhallintajärjestelmällä. Minicondan asennus sujuu nopeasti ja se vie tilaa huomattavasti vähemmän kuin Anaconda.

Löydät Minicondan Windowsille, Macille ja Linuxille osoitteesta

https://docs.conda.io/en/latest/miniconda.html

Valitse oma käyttöjärjestelmäsi (Windows, macOS tai Linux) ja asenna Miniconda oletusasetuksilla.

Käynnistä asennuksen jälkeen Anacondan komentorivi: Windows-koneilla Anaconda prompt (miniconda3) Windowsin käynnistysvalikosta ja MacOS-koneilla terminal.

Komentorivillä voit asentaa tarvittavat kirjastot. Data-analytiikkaa varten suosittelen ainakin seuraavia:

  • conda install jupyter (jupyter notebook on data-analytiikassa suosittu ohjelmointiympäristö).
  • conda install pandas (data-analytiikan peruskirjasto, jonka mukana asentuu myös numeerisen laskennan peruskirjasto numpy).
  • conda install seaborn (grafiikka kirjasto, jonka mukana asentuu myös grafiikan peruskirjasto matplotlib).
  • conda install scikit-learn (koneoppimisen kirjasto, jonka mukana asentuu myös tieteellisen laskennnan peruskirjasto scipy).
  • conda install statsmodels (tilastollisten mallien kirjasto mm. aikasarjaennustamiseen).
  • conda install xlwings (kirjasto Excelin ohjaamiseen).
  • conda install pandas-datareader (tämän avulla voi lukea tietoja useista nettilähteistä).
  • conda install openpyxl (Excel-tiedostojen avaamiseen).
  • conda install xlsxwriter (Excel-tiedostojen kirjoittamiseen).

Myöhemmin voit tarpeen mukaan asentaa muita kirjastoja.

Asennuksen jälkeen

Tutustu asennuksen jälkeen Jupyter notebookin toimintaan.