verteego data suite : support du lancement
TRANSCRIPT
1
BIG
DATA
PAR
IS: V
ERTE
EGO
DATA
SUI
TE O
FFIC
IAL
LAUN
CH
U N D E R S T A N D T O D A Y . K N O W T O M O R R O W .
+33(0)1 47 70 08 90
+33(0) 6 99 32 98 99
LANCEMENT
VERTEEGO
DATA SUITE 1.0
BOÎTE A OUTILS DE DATA SCIENCEMardi 7 mars 2017, 12h30-13h00
Big Data Paris, Salle APalais des Congrès, Paris 17ème arr.
France
22VOS INTERVENANTS
Mehdi EL BRINILead R&D engineer, Verteego
@elbrinidiary
Jeremy FAINHead of Growth, Verteego
@jeremy_fain
33
12:30
PROGRAMME
PRESENTATION DES INTERVENANTS & PROGRAMME
12:35
1- Raison d’être2- Utilité3- Pour qui ?4- Ce que n’est pas la Verteego Data Suite5- Composants intégrés dans la Verteego Data Suite6- Services
VERTEEGO DATA SUITE : POSITIONNEMENT ET CHOIX TECHNOLOGIQUES
12:451- Arriver jusqu’à la page GitHub2- Sur la Google Cloud Platform3- Sur vos machines UNIX
INSTALLER LA VERTEEGO DATA SUITE : MODE D’EMPLOI
12:55 QUESTIONS
44
RAISON D’ÊTRE DE LA VERTEEGO DATA SUITE
555
La première et la seule suite logicielle pour data scientists…
…100% Gratuite« En téléchargement libre »
…100% Open source« Pas une boîte noire »
…100% Rassurante« Composée de modules leaders mondiaux uniquement »
66
QU’EST-CE QUE LA VERTEEGO DATA SUITE ?
77
UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES FLUX DE DONNEES
NETTOYAGE AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
88
POUR QUI LA VERTEEGO DATA SUITE ?
99
A QUI S’ADRESSE LA VERTEEGO DATA SUITE
Utilisateurs
Plutôt profils
développeurs !
ou statisticiens
qui savent
scripter
Objectifs
Pour une
efficacité
maximale
Contexte
Pour les PoCs
comme pour la
production
1010
CE QUE LA VERTEEGO DATA SUITE N’EST PAS
1111
LA VERTEEGO DATA SUITE N’EST PAS UNE DISTRIBUTION DE HADOOP
1212
CHOIX TECHNOLOGIQUES
13
Interconnectez vos applications et lancez des workflows de traitement
automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT VOS DONNEES
Créez et appliquez des modèles prédictifs sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
14
Interconnectez vos applications et lancez des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT VOS DONNEES
Créez et appliquez des modèles prédictifs sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
15
Interconnectez vos applications et lancez des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT VOS DONNEES
Créez et appliquez des modèles prédictifs sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
MEHDI HELP STP.
16
Interconnectez vos applications et lancez des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT VOS DONNEES
Créez et appliquez des modèles prédictifs sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
17
Interconnectez vos applications et lancez des workflows de traitement automatisés
ORCHESTRATION DE FLUX DE DONNEES
Scriptez en Python, en R, en Bash ou en tout autre langage de votre choix pour réaliser
vos PoC d’intelligence artificielle
NOTEBOOKS DE SCRIPTING
Expliquez à la machine quelles routines appliquer pour nettoyer vos corpus de
données
NETTOYEZ AUTOMATIQUEMENT VOS DONNEES
Créez et appliquez des modèles prédictifs sur vos flux de données
JUSQU’AU PREDICTIF
Explorez vos données, créez des tableaux de bord pour les décrire, et partagez-les à
qui bon vous semble
ANALYSES ET DATAVIZ
1818
UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES FLUX DE DONNEES
NETTOYAGE AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
1919
ET LA PATTE VERTEEGO DANS TOUT CA ?
Interface
Utilisateurs
homogène
Programme
d’installation unifié,
documenté,
simple, rapide et
personnalisable
Mais aussi :
- La veille technologique en continu
- La « plomberie »
ex. connecteur NiFi - OpenRefine
2020
CHOIX TECHNOS, UI HOMOGENE, INSTALLATION UNIFIEE, « PLOMBERIE », COMMUNAUTE
UNE SUITE DE DATA SCIENCE TOUT LE LONG DE LA CHAÎNE DE LA DATA
ORCHESTRATION DES FLUX DE DONNEES
NETTOYAGE AUTOMATIQUE
ANALYSES & DATAVIZ PREDICTIF
SCRIPTING
2121
SERVICES
2222
Le logiciel est gratuit, les services sont payants
• Intra-entrepriseou
• Des sessions organisées chez
Verteego (à Paris) mêlant des
participants de tous horizons
Ex. de tarifs de support par email
exclusivement :• 100€ H.T. / mois /
utilisateur pour jusqu’à 5 questions
• 500€ H.T. / mois / utilisateur pour un nombre illimité de
questions
• Clouds publics : Google Cloud
Platform, AWS, MS Azure
• Clouds privés : Outscale, OVH,…
HEBERGEMENTFORMATION SUPPORT
La Verteego Data Suite 1.0 est 100% Open Source, 100% Gratuite, 100% Composée de modules leaders mondiaux chez les Data Scientists
2323
OÙ TROUVER LA VERTEEGO DATA SUITE ?
2424
2525
2626
2727
2828
OÙ INSTALLER LA VERTEEGO DATA SUITE ?
2929
Réponse : OÙ VOUS VOULEZ
1.
Cloud public
2.
Cloud privé
3030
COMMENT INSTALLER LA VERTEEGO DATA SUITE ?
3131
CHAMPAGNE A 13H15 STAND N°106
33