data science meets developers - jonne heikkinen, solita
TRANSCRIPT
![Page 1: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/1.jpg)
DATA SCIENCE MEETSDEVELOPERSJonne Heikkinen, Data Scientist
![Page 2: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/2.jpg)
Jonne Heikkinen@jonneheikkinen
~5 vuotta alalla
M.Sc. Comp sci
R&D, asiakasanalytiikka, suosittelukoneet, konenäkö, NLP
Data scientist @ solita
![Page 3: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/3.jpg)
”Data science is about extracting knowledge from
data.
![Page 4: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/4.jpg)
KONEIHMINEN
vs.
PÄÄTÖKSENTEKIJÄ
![Page 5: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/5.jpg)
PÄÄTÖKSENTEKIJÄ:KONE
![Page 6: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/6.jpg)
PÄÄTÖKSENTEKIJÄ:KONE
1 Mitä on koneoppiminen?
![Page 7: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/7.jpg)
1 Mitä on koneoppiminen?
2 Mitä ongelmia koneoppimisella voidaan ratkaista?
PÄÄTÖKSENTEKIJÄ:KONE
![Page 8: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/8.jpg)
1 Mitä on koneoppiminen?
2 Mitä ongelmia koneoppimisella voidaan ratkaista?
3 Koneoppiminen tuotantoratkaisuksi?
PÄÄTÖKSENTEKIJÄ:KONE
![Page 9: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/9.jpg)
1 Mitä on koneoppiminen?
2 Mitä ongelmia koneoppimisella voidaan ratkaista?
3 Koneoppiminen tuotantoratkaisuksi?
4 Miksi ohjelmistokehittäjän stackki on kultaa?
PÄÄTÖKSENTEKIJÄ:KONE
![Page 10: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/10.jpg)
![Page 11: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/11.jpg)
MACHINE LEARNING
SINCE 1959
![Page 12: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/12.jpg)
DATA
ML-WORKFLOW
LEARN MODEL
![Page 13: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/13.jpg)
SupervisedUnsuper-
vised
Machine learning
Reinforce-ment
SUB-CATEGORIES
![Page 14: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/14.jpg)
SOVELLUSKOHTEET
› Suosittelukoneet (Netflix, Amazon).
› Ennustaminen. Asiakaspoistuma, huolto.
› Tunnistaminen. Facial, speech, fraud etc.
› Täysin uudet palvelut, jotka perustuvat ML
![Page 15: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/15.jpg)
PALVELUT:TOUCHPOINTIT,
LIIKETOIMINNAN-KEHITYS
1. Kerää javastaanottaa
2. Rikastaa
3. Varastoija jalostaa
4. Machine learning
6. Julkaiseehyödynnettäväksi
OPERATIIVISET JÄRJESTELMÄT,SENSORIDATAN LÄHTEET &
DIGITAALISET PALVELUT
ULKOISET TIETOLÄHTEET
![Page 16: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/16.jpg)
4. Machine learning
![Page 17: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/17.jpg)
VA
AD
ITT
U T
EK
NIN
EN
O
SA
AM
INE
N
DATAN MÄÄRÄ
DATA EI MAHDU MUISTIIN
![Page 18: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/18.jpg)
4. Machine learning
![Page 19: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/19.jpg)
PREPARE DATA
FEATURE SELECTI
ON
TRAIN MODEL
EVALUATE
ML-WORKFLOW
![Page 20: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/20.jpg)
Measurement-device 1..n
timestamp event … var_n Activity
Truck total_hours
time_from_maintentance
acceleration_magnitude
... feature_m Activity
RAW DATA
FEATURESPREPROCESSING, E.G., HANDLE
MISSING VALUES
n > m
![Page 21: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/21.jpg)
TRAIN MODEL
![Page 22: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/22.jpg)
VALIDOINTI
1/4 1/4 1/4 1/4
1/4 1/4 1/4 1/4
1/4 1/4 1/4 1/4
1/4 1/4 1/4 1/4
Fold 1
Fold 2
Fold 3
Fold4
Testidata
Opetusdata60% 40%
Holdout K-fold
![Page 23: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/23.jpg)
SA
AV
UT
ET
TU
HY
ÖT
Y
KÄYTETTY AIKA
STATISTICAL RIGOR
QUICK ’N DIRTY
![Page 24: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/24.jpg)
SUMMMM:
› Data engineerin rooli on avainasemassa, kun tehdään koneoppimisratkaisuita tuotantoon.
› Rakentavat ja ylläpitävät skaalautuvia älykkäitä järjestelmiä.
› Implementoivat yhdessä menetelmätieteiden asiantuntijoiden kanssa ratkaisuja tuotantoon.
› Analyysi ilman, että se menee käyttöön: 0 pistettä.
![Page 25: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/25.jpg)
1 Ota joku oma datasetti, jonka tunnet hyvin.
2 Choose your weapon.
3 Pyörittele, kokeile, testaa.
4 Esim. kaggle–skabat.
MITEN LIIKKEELLE
![Page 26: Data Science meets Developers - Jonne Heikkinen, Solita](https://reader030.vdocument.in/reader030/viewer/2022021420/58ef84811a28abb0498b4623/html5/thumbnails/26.jpg)