big dive into big data at startu saturday europe

59
StartupSaturday / 13 dic 2014 TRAINING DATA-DRIVEN PROFESSIONALS Leonardo Camiciotti @top_ix @bigdive_eu

Upload: startupsaturdayeurope

Post on 14-Jul-2015

64 views

Category:

Data & Analytics


0 download

TRANSCRIPT

StartupSaturday / 13 dic 2014

TRAINING DATA-DRIVEN PROFESSIONALS

!Leonardo Camiciotti

!@top_ix

@bigdive_eu

MISSION/ GESTIONE IX NORD-OVEST ITALIA / SUPPORTARE L’INNOVAZIONE VALORIZZANDO GLI ASSET TECNOLOGICI E INFRASTRUTTURALI

80+ MEMBRI

CONSORZIO NON PROFIT

PARTECIPAZIONE PUBBLICA & PRIVATA

#TOP-IX StartupSaturday / 13 dic 2014

ATTIVITÀ “CORE”

#TOP-IX

GESTIONE E SVILUPPO DEL

SVILUPPO DI PROGETTI E STRUMENTI VOLTI A PROMUOVERE INNOVAZIONE, IMPRENDITORIALITÀ, COMPETENZE E IMPATTO SOCIALE !

SVILUPPO E VALORIZZAZIONE DI NEUTRAL

ACCESS POINT (INTERNET

EXCAHNGE)

DEVELOPMENT PROGRAM

PER LO SCAMBIO DI TRAFFICO INTERNET

IAAS & CLOUD

TECNOLOGIE E INFRASTRUTTURE

(E.G. CLOUD, STORAGE, BANDA, STREAMING, COLOCATION …)

StartupSaturday / 13 dic 2014

IL DNA DI TOP-IX

#TOP-IX StartupSaturday / 13 dic 2014

NEUTRALITYSHARING

Values

COLLABORATION

MEASURABILITYHANDS ON / BITS ON

Approaches DISSEMINATION

INCLUSIONINNOVATION

Objectives

GROWTH

0100111010

BIT CONOSCENZA PERSONE

“INFRASTRUTTURA”

VALORI

OBIETTIVI

APPROCCIO

DATI

OPEN DATA

Organizzazione OPEN DATA CONFERENCE

Partecipazione alla DIGITAL AGENDA ITALIANA

1° LEGGE REGIONALE OPEN DATA

2011 DIC 2012 OTT

APPS4ITALY 1° CONTEST OPEN DATA

2011 NOV

PIEMONTE VISUAL CONTEST 2

2014 NOV

Sviluppo 1° PORTALE OPEN DATA

2010 DIC

BIG DATA

2° edizione BIG DIVE

1° edizione BIG DIVE

2010 MAG

2011 DIC 2012 OTT 2013 GIUOrganizzazione BIG DATA CONFERENCE

IMPARARE DALL’ESPERIENZA

#TOP-IX

3° edizione BIG DIVE

2014 GIU

StartupSaturday / 13 dic 2014

PIEMONTE VISUAL CONTEST

2013 OTT

PARLIAMO DI BIG DATA QUANDO IL VOLUME, LA VARIETÀ E LA VELOCITÀ DEI DATI SONO TALI DA NON POTER ESSERE GESTITI CON NORMALI STRUMENTI, TECNICHE E PC …

#DEFINITION

DEFINIZIONE DI BIG DATA

StartupSaturday / 13 dic 2014

SI AVVERTE LA NECESSITÀ DI ULTERIORI DATI PER COMPRENDERE DINAMICHE E COMPORTAMENTI DI SISTEMI E FENOMENI COMPLESSI. !

#DEFINITION StartupSaturday / 13 dic 2014

MA ALLO STESSO TEMPO

!

LEVE SORGENTI

CONNESSIONI ALWAYS-ON !SOCIAL NETWORK !IL MOVIMENTO OPEN DATA !LE SMART CITY !IL PROCESSO DI DIGITALIZZAZIONE DELLA CONOSCENZA

HPC / HIGH PERFORMANCE COMPUTING !CLOUD !OPEN SOURCE !LA RIDUZIONE DEL COSTO DELLO STORAGE !LA NASCITA DELLA DATA-SCIENCE E DELL’ INFONOMICS

#BIGDATA StartupSaturday / 13 dic 2014

ESTRARRE VALORE DAI (BIG) DATA

#USE-CASES

DATI MODELLI DECISIONI

DAI DATI ALL’ IMPATTO

StartupSaturday / 13 dic 2014

#LOGISTICA #MONITORAGGIO #SENSORI

TESCO PREVEDE DI RISPARMIARE OLTRE 20M€ GRAZIE ALLA RAZIONALIZZAZIONE DEGLI IMPIANTI DI REFRIGERAZIONE.

IMPATTO

StartupSaturday / 13 dic 2014 #USE-CASES

“ZHANGBEI NATIONAL WIND AND SOLAR ENERGY” PREVEDE DI SERVIRE 14.000 UTENZE AGGIUNTIVE USANDO FONTI RINNOVABILI.

IMPATTO

StartupSaturday / 13 dic 2014 #USE-CASES

#ENERGIA #RISORSE

MAGGIOR COINVOLGIMENTO E SENSIBILIZZAZIONE DEGLI UTENTI RIDUZIONE DEI CONSUMI SU BASE STAGIONALE E GIORNALIERA.

IMPATTO

StartupSaturday / 13 dic 2014 #USE-CASES

#ENERGIA #DATA-VIZ #TRASPARENZA #RIDUZIONE DI CONSUMI E SPRECHI !!

#MOBILITÀ #MONITORAGGIO #EFFICIENZA #MIX DATI UTENTE+ VEICOLO !!!

MAGGIOR COINVOLGIMENTO E SENSIBILIZZAZIONE DEGLI UTENTI, MIGLIORAMENTO DEL SERVIZIO.

IMPATTO

#USE-CASES StartupSaturday / 13 dic 2014

#MOBILITÀ #MONITORAGGIO #PREVISIONE !!!

RIDUZIONE DELLE INEFFICIENZE E DEFINIZIONE DI POLIZZE ASSICURATIVE SU MISURA.

IMPATTO

#USE-CASES StartupSaturday / 13 dic 2014

#SMARTCITY #MONITORAGGIO !!!

IMPATTO

#USE-CASES

COINVOLGIMENTO DEI CITTADINI, MAGGIORE CONSAPEVOLEZZA, IMPATTO SUL LOCAL POLICY MAKING.

StartupSaturday / 13 dic 2014

#USE-CASES

RIDUZIONE DEI COSTI, SEGMENTAZIONE DELLE COPERTURE SANITARIE, MIGLIORAMENTO DELLE DIAGNOSI.

StartupSaturday / 13 dic 2014

#SANITÀ #TRACKING #PREVISIONE #PREVIDENZA !

!!!

IMPATTO

#FINANZA #BANCHE !!!

IMPATTO

#USE-CASES

ONE-TO-ONE MARKETING, SEGMENTAZIONE DEGLI UTENTI, SCOPERTA DELLE FRODI, “GESTIONE” DEL RISCHIO.

StartupSaturday / 13 dic 2014

#SOCIAL IMPACT !!!

#USE-CASES StartupSaturday / 13 dic 2014

WARNING

LE STORIE DI SUCCESSO SONO ANCORA CASI ISOLATI.

#BIGDATA StartupSaturday / 13 dic 2014

LA SEMPLICE RACCOLTA DEI DATI NON SIGNIFICA ATTIVARE PROCESSI DI BIG DATA.

WARNING

#BIGDATA StartupSaturday / 13 dic 2014

I BIG DATA NON COSTITUISCONO DA SOLI UN MODELLO DI BUSINESS CHE, INVECE, DEVE ESSERE SVILUPPATO.

WARNING

#BIGDATA StartupSaturday / 13 dic 2014

I BIG DATA RICHIEDONO:

/ PROTOCOLLI E FORMATI STANDARD / COLLABORAZIONE E CONDIVISIONE / TEORIE E MODELLI (SCIENTIFICI) / IL SUPPORTO DELLE ISTITUZIONI / LA PRESENZA DI START-UP / FIGURE PROFESSIONALI DATA-ORIENTED

#BIGDATA StartupSaturday / 13 dic 2014

1° EDIZIONE OTT 2012 2° EDIZIONE GIU 2013 3° EDIZIONE GIU 2014

4° EDIZIONE coming soon

StartupSaturday / 13 dic 2014 #BIGDIVE

BIG DIVE È UN PROGRAMMA DI FORMAZIONE DI CINQUE SETTIMANE VOLTO AL TRAINING DI FIGURE PROFESSIONALI CAPACI DI VALORIZZARE I BIG DATA.

StartupSaturday / 13 dic 2014 #BIGDIVE

MA DI UN APPROCCIO “STREET FIGHTING”

NON ABBIAMO BISOGNO DI UN’UNIVERSITÀ

StartupSaturday / 13 dic 2014 #BIGDIVE

IL TEAM DI BIG DIVE

StartupSaturday / 13 dic 2014 #BIGDIVE

DEVELOPMENT

!/ PYTHON !/ TurboGears2 web framework

/ Hadoop & Mapreduce !/ Introduzione a NO-SQL DB

!

LE DISCIPLINE

StartupSaturday / 13 dic 2014 #BIGDIVE

VISUALIZATION

!/ Basi teoriche di data-visualization !/ Introduzione a Javascript e ProcessingJS !/ D3.JS !/ Workshop intensivo di data-visualization !

LE DISCIPLINE

StartupSaturday / 13 dic 2014 #BIGDIVE

DATA SCIENCE

!/ Network science

/ Basi di statistica !/ Data analysis / Machine learning

!

StartupSaturday / 13 dic 2014

LE DISCIPLINE

#BIGDIVE

BIG DIVE 1 4 SETTIMANE 20 PARTECIPANTI 8 NAZIONALITÀ

#BIGDIVE

BIG DIVE 2 5 SETTIMANE 15 PARTECIPANTI 5 NAZIONALITÀ

BIG DIVE 3 5 SETTIMANE 15 PARTECIPANTI 6 NAZIONALITÀ

StartupSaturday / 13 dic 2014

#BIGDATA_PROCESS

una storia…

BIG DATA IN PRATICA

StartupSaturday / 13 dic 2014

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

I dati sono realmente BIG?

#BIGDATA_PROCESS

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

StartupSaturday / 13 dic 2014

È stato identificato un obiettivo chiaro ?

#BIGDATA_PROCESS

I dati sono realmente BIG?

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

StartupSaturday / 13 dic 2014

MisurabileBusiness-drivenImpact-driven

#BIGDATA_PROCESS

È stato identificato un obiettivo chiaro?

StartupSaturday / 13 dic 2014

I dati sono realmente BIG?

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

MisurabileBusiness-drivenImpact-driven

if not

Probabilmente si stanno sprecando tempo e risorse.

#BIGDATA_PROCESS

È stato identificato un obiettivo chiaro?

StartupSaturday / 13 dic 2014

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

I dati sono realmente BIG?

Business-drivenImpact-driven

if not

if yes

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Probabilmente si stanno sprecando tempo e risorse.

Ho grandi volumi di dati e/o i miei competitor hanno appena acquisito una soluzione BIG DATA

Misurabile

È stato identificato un obiettivo chiaro?

I dati sono realmente BIG?

Il Team ICT interno come risolve il problema al momento?

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Il Team ICT interno come risolve il problema al momento?

É necessario coinvolgere competenze specifiche, Data Scientist (eventualmente da acquisire sul mercato).

Qual è il grado di “bontà” dei dati raccolti?

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Il Team ICT interno come risolve il problema al momento?

Sono pronti per essere processati da un tool software? I Data Scientist NON sono maghi o veggenti!

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Il Team ICT interno come risolve il problema al momento?

Qual è il grado di “bontà” dei dati raccolti?

Metadata?Documentazione chiara?Regole per le operazioni manuali?

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Qual è il grado di “bontà” dei dati raccolti?

Esplorazione e pulizia dei

dati

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Metadata?Documentazione chiara?

Qual è il grado di “bontà” dei dati raccolti?

Regole per le operazioni manuali?

#time-consuming #costoso

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Metadata?Documentazione chiara?

Qual è il grado di “bontà” dei dati raccolti?

Esplorazione e pulizia dei

dati

Regole per le operazioni manuali?

dopo…

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Metadata?Documentazione chiara?

Qual è il grado di “bontà” dei dati raccolti?

Esplorazione e pulizia dei

dati

Regole per le operazioni manuali?

#time-consuming #costoso

I dati sono pronti per essere processati… ma

è necessaria una pipeline per gestire il processo.

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Richiede conoscenze di software development

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

è necessaria una pipeline per gestire il processo.

I dati sono pronti per essere processati… ma

La PIPELINE è pronta!

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

è necessaria una pipeline per gestire il processo.

I dati sono pronti per essere processati… ma

Richiede conoscenze di software development

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

La PIPELINE richiede una validazione

Solo quando il modello è accurato i Data Scientist iniziano realmente il loro lavoro.

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

La PIPELINE richiede una validazione

Algoritmi Machine learning Multivariate analysis …

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Solo quando il modello è accurato i Data Scientist iniziano realmente il loro lavoro.

La PIPELINE richiede una validazione

Forse a questo punto sono necessari un upgrade dell’infrastruttura e nuove skill.

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Solo quando il modello è accurato i Data Scientist iniziano realmente il loro lavoro.

Algoritmi Machine learning Multivariate analysis …

La PIPELINE richiede una validazione

Ed infine il risultato è

42!

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

42! Che si auspica non sia un valore ovvio!

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

Ed infine il risultato è

42!

#BIGDATA_PROCESS

E’ possibile trasformare tale processo in un modello decisionale?

StartupSaturday / 13 dic 2014

Che si auspica non sia un valore ovvio!

Ed infine il risultato è

42!

Sicuramente si avrà ora una maggiore conoscenza dello spazio-dati.

#BIGDATA_PROCESS StartupSaturday / 13 dic 2014

E’ possibile trasformare tale processo in un modello decisionale?

Che si auspica non sia un valore ovvio!

Ed infine il risultato è

42!

#BIGDATA_PROCESS

L’ “iterazione” e la consapevolezza rendono perfetti.

StartupSaturday / 13 dic 2014

Ed infine il risultato è

Che si auspica non sia un valore ovvio!

StartupSaturday / 13 dic 2014

NON SOLO DATA SCIENTIST…

#BIGDIVE

IMPACT

DATA-DRIVEN MANAGER

DATA-DRIVEN POLICY MAKER

DATA-DRIVEN DEVELOPER

DATA-DRIVEN ENTREPRENEUR

DATA-DRIVEN DESIGNER

….

GRAZIE !

[email protected] [email protected] !www.top-ix.org www.bigdive.eu !@top_ix @bigdive_eu

StartupSaturday / 13 dic 2014 #BIGDIVE