Päivitetty 6.2.2024
Data-analytiikkaan tarvittavat Python-taidot voit oppia nopeasti vaikket omaisikaan aiempaa ohjelmointikokemusta.
Ensimmäiseksi tarvitset data-analytiikkaan sopivan muistikirja-tyyppisen ohjelmointiympäristön.
Jos et halua asentaa ympäristöä omalle koneellesi, niin voit käyttää esimerkiksi ilmaista Google Colab -pilvipalvelua osoitteessa https://colab.research.google.com/. Palvelun käyttämiseen tarvitset Google-tunnuksen.
Omalle koneelle asennettavaksi ympäristöksi sopii Miniconda tai Anaconda.
Miniconda
Voit katsoa Minicondan asennuksen kulun videolta.
Miniconda sisältää Pythonin ja conda-paketinhallintajärjestelmän. Minicondan asennus sujuu nopeasti ja se vie tilaa vähemmän kuin Anaconda.
Löydät Minicondan Windowsille, Macille ja Linuxille osoitteesta
https://docs.conda.io/en/latest/miniconda.html
Valitse oma käyttöjärjestelmäsi (Windows, macOS tai Linux) ja asenna Miniconda oletusasetuksilla.
Käynnistä asennuksen jälkeen Anacondan komentorivi:
- Windows-koneilla Miniconda3 – Anaconda prompt (miniconda3) Windowsin käynnistysvalikosta
- MacOS- ja Linux-koneilla terminal/pääte.
Komentorivillä voit asentaa tarvitsemasi kirjastot/paketit. Jokaisen asennuskomennon jälkeen kestää hetken ennen kuin conda löytää sinulle sopivan version, jonka jälkeen se kysyy vielä lupaa asennukseen. Vastaa kysymykseen y-kirjaimella (ja paina enter). Data-analytiikkaa varten tarvitset ainakin seuraavat:
- conda install jupyter (Jupyter Notebook on data-analytiikassa suosittu ohjelmointiympäristö).
- conda install pandas (data-analytiikan peruskirjasto, jonka mukana asentuu myös numeerisen laskennan peruskirjasto numpy).
- conda install seaborn (grafiikka-kirjasto, jonka mukana asentuu myös grafiikan peruskirjasto matplotlib).
- conda install scikit-learn (koneoppimisen kirjasto, jonka mukana asentuu myös tieteellisen laskennnan peruskirjasto scipy).
- conda install statsmodels (tilastollisten mallien kirjasto mm. aikasarjaennustamiseen).
- conda install xlwings (kirjasto Excelin ohjaamiseen).
- conda install openpyxl (Excel-tiedostojen avaamiseen).
- conda install xlsxwriter (Excel-tiedostojen kirjoittamiseen).
Myöhemmin voit tarpeen mukaan asentaa muita kirjastoja.
Anaconda
Anaconda sisältää muiden muassa
- Pythonin
- datojen analysointiin tarvittavat ohjelmakirjastot (NumPy, pandas, jne.)
- graafiseen esittämiseen tarvittavat ohjelmakirjastot (matplotlib, seaborn jne.)
- koneoppimisen malleihin tarvittavat ohjelmakirjastot (scikit-learn jne.)
- Jupyter Notebookin ohjelmien kirjoittamiseen ja suorittamiseen
- Conda-paketinhallintajärjestelmän, jolla voit asentaa ja päivittää ohjelmakirjastoja (paketteja) siten että kirjastojen versiot ovat keskenään yhteensopivia.
Löydät Anacondan Windowsille, Macille ja Linuxille osoitteesta
https://www.anaconda.com/products/distribution
Valitse oma käyttöjärjestelmäsi (Windows, macOS tai Linux) ja asenna Anaconda oletusasetuksilla.
Ohjeita Anacondan käyttöön löydät osoitteesta
https://docs.anaconda.com/anaconda/
Anaconda sisältää paljon kirjastoja, joita et koskaan tarvitse. Jos haluat asentaa vain tarvitsemasi, niin asenna Anacondan sijasta Miniconda.
Asennuksen jälkeen
Tutustu asennuksen jälkeen Jupyter notebookin toimintaan.