Tällä sivulla on lisämateriaalia (osin päällekkäistä) pääsivulle Data-analytiikka Pythonilla.
Dataan tutustuminen ja datan valmistelu
- Datan muunnokset – osa 2 – transform(), logaritmimuunnos, stardardointi eli normittaminen.
- Puuttuvien arvojen käsittely – poistaminen ja korvaaminen
- Poikkeavien arvojen poistaminen – poikkeaviin arviohin kannattaa kiinnittää huomioita.
- Kategorisen muuttujan muuntaminen dummy-muuttujiksi
- Rivin lisääminen dataframen loppuun
- Desimaalipisteet pilkuiksi – tulostaulukoiden desimaalipisteiden muuttaminen pilkuiksi
Kuvaileva ja selittävä analytiikka
- Lukumääriä ja prosentteja – kaikki mitä tarvitset lukumäärien ja prosenttien laskemiseen ja esittämiseen
- value_counts() – monitoimityökalu lukumäärien ja prosenttien laskemiseen (myös videona)
- Merkitsevyystestausta (p-arvot) Pythonilla – yleisimmät testit tilastollisen merkitsevyyden testaamiseen
- Dataframen muotoilua – tyyliä dataframeen
- Näin poimit traficomin yli 5 miljoonan rivin datasta viime vuosina rekisteröidyt autot
Data tietokannasta
- Yhteys tietokantaan – esimerkkejä tietokannan tietojen analysoinnista
Aikasarjat
- Kynttiläkaavioita ja liukuvia keskiarvoja mplfinance-kirjaston avulla
- Esimerkki Econdb-tietokannan käytöstä
- Automaattisesti päivittyvä linkki tilastokeskuksen tietokantaan
- Bollingerin nauhat
- RSI – laskentamenetelmien vertailua
- Esimerkki yfinance-kirjaston käytöstä
Tuloksia suoraan Exceliin
- Video Excelin ja Pythonin yhteiskäytöstä – kannattaa katsoa!
- Datan pika-analyysi Pythonilla 1 – frekvenssitaulukot, ristiintaulukoinnit, tunnusluvut ja korrelaatiot Exceliin (tunnistaa automaattisesti määrälliset ja kategoriset muuttujat). Edellyttää, että koneelle on asennettu Excel.
- Datan pika-analyysi Pythonilla 2 – frekvenssitaulukot, ristiintaulukoinnit, tunnusluvut ja korrelaatiot Excel-tiedostoon (tunnistaa automaattisesti määrälliset ja kategoriset muuttujat). Koneella ei tarvitse olla Exceliä asennettuna.
- Datan automaattinen analysointi – käyttäjä määrittelee aluksi muuttujatyypit ja mahdolliset tekstimuotoiset arvot kategorisille muuttujille; laskee frekvenssitaulukot, ristiintaulukoinnit, dikotomisten muuttujien yhteenvedot, tilastolliset tunnusluvut, korrelaatiot, khiin neliö -testit, t-testit, korrelaatioiden merkitsevyydet ja kirjoittaa kaikki tulokset Excel-tiedostoon
- Datan automaattinen analysointi – edellinen Colab-muistiona
- Datan automaattinen analysointi – käyttöesimerkki titanic-datalla
- Datan automaattinen analysointi – käyttöesimerkki tip-datalla
- Datan automaattinen analysointi – käyttöesimerkki taxis-datalla
Todennäköisyyslaskentaa ja -jakaumia
- Kombinaatio-oppia – tuloperiaate, permutaatiot, kombinaatiot
- Todennäköisyyksien laskusääntöjä – yhteenlaskusääntö, kertolaskusääntö, komplementtisääntö
- Todennäköisyysjakumien peruskäsitteet – todennäköisyysjakauma, kertymätodennäköisyys, odotusarvo
- Binomijakauma
- Poisson-jakauma
- Normaalijakuma
- Simulaatioita – kolikoiden ja noppien heittoa
- Simulaatioita – asiakaspalvelupisteen jonon muodostuksen simulointi
- Simulaatioita – tuotantolinjan simulointi
- Simulaatioita – lehtikauppiaan ongelman tarkastelu simuloimalla
- Monte Carlo – myyntiprovision ennustaminen Monte Carlo -menetelmällä