du datamining à la datascience
TRANSCRIPT
Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com
Soft Computing
Séminaire « Data Mining VS Data Science »
Paris, le 05 mars 2015
Comment passer du Data Mining traditionnel à la Data Science ? Quels bénéfices ? Quels impacts ? Quels R.O.I. ?
Séminaire le 05 mars 2015
Du Data Mining à la Data Science
Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com
A propos
Soft Computing est une société spécialisée en CRM, Big Data et Digital, réunissant près de 400 consultants, délivrant des prestations de Conseil, de
Technologie et de Marketing Services.
Soft Computing est coté à Paris dans le compartiment C de NYSE Euronext (ISIN : FR0000075517, Symbole : SFT).
Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation.
Agenda : 08h45 – 09h00 : Accueil des participant 09h00 – 11h00 : Séminaire • La donnée et son exploitation : quels enjeux pour les entreprises ? • Data Miner vs Data Scientist : quelles compétences, quelles différences? • Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ? • Les retours d'expériences, les compétences requises, délais et ROI. • Conclusion.
Soft Computing vous invite à un séminaire qui abordera les questions suivantes : • Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ? • Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ? • Quels sont les pièges à éviter ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 3
SOMMAIRE SOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 4
Carte d’identité
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 5
Continuum de services
Think Build
Business
IT
Imaginer, bâtir et opérer
des programmes de conquête et de fidélisation cross-canaux, rentables et innovants
Concevoir, développer et déployer
des solutions Digitales, Big Data et CRM performantes, pragmatiques et adaptées
Run
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 6
Extraits de références 2013
Centre de services de
gestion des campagnes
marketing multicanal.
Ecoute et analyse des
sentiments des clients sur
les réseaux sociaux.
Programme relationnel
multi-devices.
Maintien en conditions
opérationnelles et
évolution du SI marketing
on et offline.
Gestion opérationnelle
des plates-formes
analytiques et marketing
ciblé.
Dispositif d’acquisition de
prospects sur tablette en
magasin.
Cadrage, conception et
déploiement d’un service
client pro-actif.
Centre de services de
datamining, de
campagnes ciblées et de
diffusion des reportings.
Personnalisation en temps
réel des contenus et
valorisation d’audience.
Déploiement d’un outil
d’automatisation des
forces de ventes.
Définition d’une stratégie
de Business Intelligence.
Applications mobiles et
personnalisation.
Pilotage de la qualité de
l’expérience client.
Optimisation des parcours
client et du taux de
transformation sur
Internet.
Référentiel client
transversal multicanal et
multiservice.
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 7
Experts reconnus
Enseigner
Ecrire
Echanger
http://blog.softcomputing.com/
https://twitter.com/#!/SoftComputing
http://www.facebook.com/softcomputing
http://www.softcomputing.com/fr/news/
http://fr.slideshare.net/softcomputing
http://www.linkedin.com/company/soft-computing
http://www.viadeo.com/fr/company/soft-computing
https://plus.google.com/+Softcomputing/
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 8
SOMMAIRE SOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 9
SOMMAIRE SOMMAIRE
Une révolution sous nos yeux
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 10
…devenu en 2010 Digital Dad (ou
mom)
Digital Native né en 1980…
Oui, le client a changé
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 11
Oui, ça s’accélère 8 des 10 premiers sites web ont moins de 10 ans
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 12
Son mode de consommation change
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 13
Son mode d’expression change
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 14
Sa relation à l’annonceur change
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 15
Son univers de choix change
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 16
Facteurs de succès : bouleversés
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 17
SOMMAIRE SOMMAIRE
Quelles conséquences sur le marketing ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 18
Dans quels domaines le marketing doit-il concentrer ses investissements ?
Les priorités du marketing changent
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 19
Individualisé
Segment Individu
2005 2015
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 20
Mobile
2005 2015
Portable Multi-device
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 21
Omnicanal
2005 2015
Centré canal et campagne Centré client et expérience
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 22
Contextuel
2005 2015
Ciblé Localisé
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 23
Temps réel
2005 2015
Au jour A la seconde
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 24
Social
2005 2015
Client Influenceur
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 25
Les compétences requises évoluent aussi
Quelles sont les 3 plus importantes compétences d’un directeur marketing
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 26
La donnée au coeur
Données
Création
Social
Web
Marketing
Mobilité
Média
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 27
SOMMAIRE SOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 28
DATAMINING VS DATA SCIENCE : BIG BANG ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 29
Les données analysées
AVANT
Périmètre
Univers de données
Format et stockage
Historique
Plusieurs mois
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 30
Les analyses
AVANT
Segmentation
Valeur, RFM, comportementale, style de consommation, marché, relationnelle,…
Score De prospection, rétention, endormissement, appétence (cross sell , up sell, canaux..), cycle d’achat, valeur future …
Etude d’impact De programme de fidélisation, déréférencement, lancement d’offre, dispositif de Marketing direct
Prévision Prévision de vente, prévision de résiliation, prévision d’appels , durée de vie…
Etude géomarketing Typologies de zone d’implantation , des études d’optimisation des réseaux de points de vente physique….
Fraude Modèles de détection des comportements atypiques
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 31
Les méthodologies
AVANT
Régression logistique
Modèle ARIMA/SARIMA
Analyse des correspondances
multiples
Analyse Factorielle
Analyse en composantes principales
…
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 32
Les outils
AVANT
Accès aux données
Manipulation de données
Analytics Restitution
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 33
L’organisation des projets et les charges
AVANT
Définition de la démarche
et des indicateurs
Extraction des données
Construction de la matrice
d’études
Analyse/ Modélisation
Présentation des résultats
2 jours 5 jours 10 jours 15 jours 10 jours
Exemple pour la mise en place d’une segmentation :
= 42 jours
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 34
Les compétences attendues pour un Datamininer
Maitrise des outils Maitrise des méthodes Sens Business
AVANT
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 35
Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 36
Au démarrage du Big data
• Des données brutes / non structurées • Accès/manipulation de données via Impala, Hive
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 37
Big data 2014
Démocratisation
Big data 2015
Démocratisation
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 38
Les données analysées
2015
Périmètre clients
Univers de données
Format et stockage
Historique
Plusieurs années
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 39
Les nouvelles analyses
2015
Analyse de parcours web
Analyse de sentiments
Segmentation multicanal
Segmentation Style de
consommation
Scores à la volée
Moteur de recommandations
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 40
Les nouvelles méthodologies utilisées
2015
Random Forest
Boosting Gradient Machine
Textmining
Réseau Bayesien
ACP avec rotation
Sequential Pattern Analysis
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 41
Les outils
2015
Accès aux données
Manipulation de données
Analytics Restitution
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 42
L’organisation des projets et les charges
2015
Exemple pour la mise en place d’une segmentation :
Définition de la démarche
et des indicateurs
Extraction des données
Construction de la matrice
d’études
Analyse/ Modélisation
Présentation des résultats
2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 43
Les compétences attendues pour un Data Scientist
Maitrise des outils Maitrise des nouvelles méthodes
Sens Business
Maintenant
GESTION DE PROJET
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 44
SOMMAIRE SOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 45
Un nouvel environnement
Données Web/ SC
Données exogènes
Données non structurées
Importante volumétrie de
données
Plus de contrainte de
stockage
Temps réel
Nouvelles méthodes
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 46
Les nouveaux besoins d’analyse
Améliorer la performance de
détection avec des données exogènes
Proposer des produits de substitution
Améliorer la performance de
détection et les temps de traitement avec de nouvelles méthodes
Analyser les sentiments
Identifier les influenceurs
Appréhender les styles de consommation
Identifier et optimiser les parcours Web
… …
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 47
SOMMAIRE SOMMAIRE
1. A propos de Soft Computing
2. La donnée et son exploitation : quels enjeux pour les entreprises ?
3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?
4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?
5. Les retours d’expériences : quelle démarche, le délai, les coûts ?
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 48
Données :
Digitales CRM
Penser applications opérationnelles et débuter simple
R.O.I.
Connaissance
Productivité opérationnelle
Analyses ad’hoc
Vision produit Vision clients
Technologies
1
2
3
4
Datamining Réconciliation
Externes
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 49
Une démarche itérative et cocréative
• Une approche pour :
– Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation,
– Benchmarker, tester et valoriser la création de valeur
– Préparer une éventuelle industrialisation
Mettre en œuvre la plateforme 2
Présentation, ajustement , validation de l’apport de
valeur, plans test 3
Représentants métiers
Définition des cas d’usages
Réaliser les cas d’usage métiers et benchmark avt
- après
4
1
Représentants métiers / SI
Recueil de l’existant et des besoins métier et SI
Représentants métiers
Recommandation et plans d’actions en vu de l’industrialisation 5
2
Décile
Lift
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 50
Architecture de travail
Lab data Large Data Fast Data
Prototyper l’algorithme
Produire les résultats
Suivre et optimiser la performance de
l’algorithme
Proposer les résultats
Intégrer l’algorithme
Développer l’algorithme
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 51
Planning et contributeurs
Run
Initialisation du centre de services
Conception et réalisation « large »
Maintenance
Monitoring applications
Administration
Gestion des projets de setup
Gestion du centre de services Program Management
Gestion des projets d’évolutions
Busin
ess
IT
Gestion d
e p
roje
t et
de s
erv
ices
Setup
Sprints algorithme sur le « lab »
Mise en place architecture
Définition du SLA
Conception et réalisation « fast »
Tests
Sprints d’amélioration algorithme sur le « lab »
Surveillance de la santé de l’algorithme « lab »
Infr
a
Hard & soft
Hébergement et monitoring
Data exploration
M1 M2 M3 M4 M5
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 52
Surement pas seul
Marketing Datascience Programmation
www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 53
Combien ça coûte ?
X*100 K€ / an Batch As a service
X* 1 M€ / an Industrialisation Temps réel Datawahouse+big data