xebicon'16 : air france klm - le big data au service de la relation client personnalisée par...
TRANSCRIPT
@xebiconfr #xebiconfr
Air France KLM
“Le Big Data au service de la relation client personnalisée”
Michael Chalamel
&
Mouloud Lounaci
@xebiconfr #xebiconfr
320 destinations114 pays
jusqu’à 2 200 vols / jour
534 avions en exploitation
AIR FRANCE-KLM
4
1.1
+24 millions Flying Blue +3 millions+19 millions
1 vente / 5 secondes (sur www.airfrance.com)
@xebiconfr #xebiconfr
Département Recherche Opérationnelle (RO)
“Une équipe d’experts en Optimisation et en Data Science accompagnant les directions métier dans des études stratégiques à fort ROI et avec un important écosystème d’outils opérationnels”
70 personnes : Ingénieurs / Docteurs en Recherche Opérationnelle, Data Science et informatique
❖ IT Groupe AIR FRANCE-KLM
❖ Plus de 25 applications utilisées tous les jours
❖ Conseil stratégique pour les Programmes de transformation (Transform 2015, Perform 2020)
❖ Innovation
5
1.2
@xebiconfr #xebiconfr
L’enjeu du Big Data pour AIR FRANCE-KLM
❖ 2011 - Le déclencheur : ➢ Système Revenue Management “in house” avec Hadoop v1 & MapReduce
❖ 2014 - Naissance du Programme Big Data➢ Objectif: promouvoir le “Big Data” auprès des directions métier à travers des PoC➢ Définition d’une infrastructure standard (Hortonworks, MongoDB, Talend)
➢ Implication du service de Recherche Opérationnelle sur les problématiques Data Science
❖ Succès : PoC industrialisés
6
1.3
@xebiconfr #xebiconfr
Notre Activité Data Science
Maintenance prédictive
PrévisionDemande / Trafic / Recette
Prévision d’annulation
7
Services et offres personnalisés
Gestion des plaintes et irritants
1.4
@xebiconfr #xebiconfr
Focus - Relation client attentionnée
La Data au service de l’expérience client depuis la réflexion d’achat jusqu'à l’après-vol
8
Centralisation des données● Service personnalisé● Amélioration marketing client ● Offres commerciales personnalisées en
fonction des historiques de voyage
De nouveaux services en temps réel● fluidifier le parcours du passager● géolocalisation en temps réel des bagages
Plateforme opérationnelleHadoop / Kafka / Spark / MongoDB
1.5
@xebiconfr #xebiconfr
Une relation attentionnée sur le long terme
9
… Voyage ‘N’ Voyage ‘N+1’ ...
l’après-vol
Représentation de nos différents points de contact avec nos passagers
réflexion d’achat
1.6
@xebiconfr #xebiconfr
Une relation attentionnée sur le long terme
10
… Voyage ‘N’ Voyage ‘N+1’ ...
l’après-volréflexion d’achat
1.6
Recherche site web
Enregistrement en ligne Embarquement
@xebiconfr #xebiconfr
Problématique: Accélérer la mise en production
➔ Plus de services personnalisés à délivrer en production plus rapidement
Comment accélérer la mise en production des applications ‘Data Science’ ?
11
1.7
@xebiconfr #xebiconfr
De l’idée à la production… axes d’accélération
14
Et si on … ?
Quelles données ?Peut-on faire … ?
Quelle priorité ?
Quelle Plateforme ?
Où sont les données ?
Quels outils ?
Comment partager avec les métiers ?
Qui ?
DevOps ?
Quand ?
Qui ?
2.2
@xebiconfr #xebiconfr
L’importance d’une bonne gouvernance
❖ Vue d’ensemble, coordination des besoins
❖ Connaissance des données et des produits existants
16
À qui
soumettre
une idée et
comment la
prioriser?
2.3
@xebiconfr #xebiconfr
Exploration en Data Science
❖ Data Driven, tout dépend des données.
❖ Résultat Incertain, à la fois en faisabilité, Temps et en qualité.
❖ Outils Interactifs pour explorer les Données.
17
comment
accéder à
la donnée
?
Quels
outils
?
2.4
@xebiconfr #xebiconfr
Visualiser pour valider
❖ Mise en place rapide et simple de data visualisation.
❖ Accessible aux métiers.
❖ Feedback instantané.
18
Quels
outils
?
Comment
interagir
avec les
métiers
?
2.5
@xebiconfr #xebiconfr
❖ Automatisation du delivery pour entrer dans une démarche d'amélioration continue.
❖ Passer de l’analyse de données et prototypage à des applications data science.
❖ Simplifier les complexités liées au Big Data et Spark.
19
PoC Permanent vs Produit
DevOps et
Data Science
c’est possible
?
Comment
gérer les
données
?
2.6
@xebiconfr #xebiconfr
Focus sur l’organisation
21
Instance “Data Gouvernance”
❖ Centralisation des données
❖ Coordination des besoins sur les sujets data
❖ Gouvernance de la donnée (qualité, sécurité, data management)
❖ Agile À qui
soumet
tre une
idée
?
Comment
prioriser
?
2.7
@xebiconfr #xebiconfr
Faciliter l’exploration
22
❖ Besoin et objectif clairs
❖ Données identifiées et disponibles
❖ Plateforme d’exploration adaptée et accessible
On ne peut pas explorer plus vite mais on peut commencer plus tôt
2.8
@xebiconfr #xebiconfr
Faciliter l’exploration
23
❏ Définir le besoin ❏ Identifier les données❏ Définir les objectifs
❏ Cloud privé❏ Plateforme Discovery❏ Environnements
virtualisés
❏ Notebook Python Spark
Comment
accéder à la
donnée
?
Quels
outils
?
2.8
@xebiconfr #xebiconfr
Focus sur la Data Visualisation
24
Indispensable pour valider les solutions efficacement avec le métier
❖ Outils utilisés
Quels
outils
?
Comment
interagir
avec les
métiers
?
2.9
@xebiconfr #xebiconfr
De l'analyse à l’application Data Science
25
❖ Abstraction sur les complexités liées à la configuration de Spark
❖ Guider les Data Scientists dans la structure du code et les Tests
❖ Bootstraper le lancement des applications Spark
2.10
@xebiconfr #xebiconfr
Framework Python Spark
26
❖ Interactivité
❖ Visualisation
❖ User friendly
2.11
@xebiconfr #xebiconfr
Data Science et DevOps
28
❖ Pipeline de delivery automatisée avec Bamboo.
❖ Test / build dans une Image Docker.
❖ Package au format PEX (Virtualenvs ++).
❖ Implication des Ops dans la définition du process de delivery et du format du livrable.
PEXPython EXecutable
DevOps et data
science c’est
possible
?
2.12
@xebiconfr #xebiconfr
Intégration des nouvelles données
❖ Intégrer une nouvelle source de données➢ Valider la structure, le format➢ Fréquence
❖ Reproduire la préparation de données➢ Nettoyage / filtrage
❖ DevOps
29
Importance de l’intégration de nouveaux flux de données dans le système opérationnel
Comment
gérer les
données
?
2.13
@xebiconfr #xebiconfr
Comment accélérer la mise en production des applications ‘Data Science’ ?
30
Data & Business Management
Cloud privéEnv. Discovery
Notebooks
OutillageSpotfire / R-Shiny /
D3.js
FrameworkDevOps
Penser “Produit”
2.14
@xebiconfr #xebiconfr
Le partage de connaissance cher à Xebia
❖ Repository de packages internes
❖ Rendez-vous mensuel dédié au partage de connaissance
❖ Identification de référents par domaine d’expertise
❖ Documentation et template de projets Data
31
2.15