synodiance > seo - le search de demain - table ronde ebg - 19/06/2014
Post on 05-Dec-2014
2.806 Views
Preview:
DESCRIPTION
TRANSCRIPT
Le Search de Demain - 19/06 Sémantique, Recherche vocale & conversationnelle
Intervenants
Daphné Garcin / Expedia Inc. Emmanuel Alix / Lequipe.fr Nicolas Desgranges / Orange Fabien Poulard / Dictanova Yann Sauvageon / Synodiance
Daphné Garcin / Expedia Inc.
Spécialiste SEM Senior Expedia › 10 ans d’expérience professionnelle, dont 5 en marketing digital et 3 en SEM › Expérience globale sur les marchés européens, américains et asiatiques › Responsable de stratégie et d’exécution SEM (budgets de l’ordre du M$ /an)
Expedia Inc › Agence de voyage en ligne (OTA) fondée en 2001, spin off de Microsoft › L’un des 2 leaders mondiaux en vente d’hôtels › Expedia vend aussi des vols, séjours, activités, locations de voitures et croisières en temps que tierce-partie (+ technologie en white label)
Mes intérêts › Passion pour les produits de search et Google › Comprendre l’évolution des usages et s’adapter à un marketing digital de plus en plus informé, automatisé, complexe et sous pression compétitive
Emmanuel Alix / Lequipe.fr
Directeur Marketing et Projets
Nicolas Desgranges / Orange
Directeur marketing Search Orange › Orange et son moteur de recherche = Un moteur de recherche généraliste WEB et spécialisé sur l’écosystème Orange
Fabien Poulard / Dictanova
Dirigeant Fondateur de Dictanova SAS › Docteur en TAL (informatique + linguistique)
Dictanova › Solutions pour l’acquisition de connaissance marché (consommateurs et concurrents)
› Fondée en 2011 › 12 personnes aujourd’hui
Industrialise l'analyse de verbatim par la rigueur linguistique
Sommaire
Les nouveaux usages de recherche
Comment Google façonne ces nouveaux usages
Comment s’adapter à ces changements de fond
1. Les nouveaux usages du search
1/ Les nouveaux usages de recherche
1/ Les nouveaux usages de recherche
« OK Google »
1/ Les nouveaux usages de recherche
"I wouldn’t be surprised" if mobile search exceeded desktop queries
this year.
Matt Cutts Head of the webspam team Google – Mars 2014
95%
4,7%
14,4%
15,0%
16,4%
16,7%
18,9%
19,0%
23,0%
25,5%
30,0%
32,2%
36,0%
42,9%
51,6%
59,5%
64,1%
67,2%
82,6%
87,9%
93,3%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
assurance retraite
ouvrir livret
assurance auto
billet avion
mode femme
jeans homme
hotel paris
restaurant paris
concert paris
beyoncé
serrurier
starbucks
franprix paris 16
serrurier lyon
starbucks paris
restaurant à proximité
station service paris
où suis je
macdo le plus proche
boulangerie à proximité
Part des requêtes mobiles – Mars 2014
1. Le contexte mobile
13,1% 12,1%
14,0% 15,8%
19,3% 19,5% 19,5%
26,3%
31,7% 30,7%
27,7%
32,4%
37,6%
40,5% 40,3%
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
Horaires Cinéma
1/ Les nouveaux usages de recherche
1/ Les nouveaux usages de recherche
Source : http://www.businessinsider.com/global-smartwatch-sales-set-to-explode-2014-3
1/ Les nouveaux usages de recherche
Source : http://www.businessinsider.com/the-internet-of-everything-2014-slide-deck-sai-2014-2?op=1
Source : http://www.businessinsider.com/the-internet-of-everything-2014-slide-deck-sai-2014-2?op=1
1/ Les nouveaux usages de recherche
Constat sur les nouveaux usages de recherche Le clavier est inadapté sur des objets connectés ou des supports écrans déportés (TV, voiture,..). Une réponse immédiate est souhaitée à la place d’une liste standard de 15 liens.
L’intérêt du vocal avec les recherches complexes
1/ Les nouveaux usages de recherche
De nouvelles typologies de recherche
› Depuis que la recherche sur mobile est devenue naturelle (+ de 16% de nos recherches en 2013 !), on constate les évolutions suivantes :
Recherches de plus de 3 mots en langage naturel
Avec des abréviations (fréquent sur mobile)
Sans vigilance sur les fautes d’orthographes / de frappe
Des questions de plus en plus pointues
1/ Les nouveaux usages de recherche
De nouvelles typologies de recherche
Variations autour de l’orthographe
banque populaire du massif central
1/ Les nouveaux usages de recherche
Mobile > L’optique SEM › Part des clicks payants
› Le mobile croit rapidement. › Passage de 7,3% a 12,5% (Janvier a Décembre 2013 dans la zone Euro*)
› Inflation de CPC en Mobile
› 26% d’augmentation en zone Euro de 2012 a 2013* (le Mobile rejoint presque le Desktop en CPC moyen, alors que l’attribution reste encore un domaine a éclaircir et améliorer dans l’industrie)
› Evolution des requêtes
› Pas de variation poussée des mots clé sur Mobile versus Desktop › Différences sur la concision et le caractère immédiat/local des requêtes
*selon une étude de Marin Software : « Mobile Search Advertising Around The Globe » (2014)
1/ Les nouveaux usages de recherche
1/ Les nouveaux usages de recherche
2/ Comment Google façonne
ces nouveaux usages
2/ Comment Google façonne ces nouveaux usages
Trouver le mot clé dans le
contenu
Apporter une réponse à
l’internaute
Freebase Schema.org Knowledge
Graph Hummingbird
Google et la montée du web sémantique
2/ Comment Google façonne ces nouveaux usages
2/ Comment Google façonne ces nouveaux usages
Recherche vocale et conversationnelle
L‘analyse sémantique devient obligatoire pour les moteurs de recherche
reconnaissance
vocale
(speech2text)
1) extraction : sémantique :
reconnaissance des termes pertinents
2) exploitation
appel du service avec bons paramètres
réponse
« quel temps
fait il à Lyon »
« temps » + « lyon » =
Météo + lyon
service météo
paramètre ville = lyon
C’est quoi l’analyse sémantique par les moteurs de recherche ?
Une interprétation de la requête de l’internaute L’exploitation des micro-formats > nouvelles informations sémantiques dans les pages web ..et le web sémantique ? > des résultats enrichis de nouvelles informations immédiates grâce au graphe de liens
verbe
sujet complément
prédicat
sujet objet
est né à
Linguistique
Web sémantique
RDF graph
2/ Comment Google façonne ces nouveaux usages
sujet prédicat objet
ex sister in law 19 juin 1972
41 ans
loves
jealous
A quoi ça sert ?
Les dessous de la recherche sémantique
RI 1990 : › Retourner le document correspondant à une requête
› Un doute ? retourner une liste de documents
› Espérons que quelqu’un ait utilisé ces mots clés !
RI 1998 : › Trop de documents pour une même requête
› Prise en compte d’éléments extérieurs (ex : Page Rank)
Les dessous de la recherche sémantique
Sémantique ? › Lexical › Syntaxique › Sémantique (sens local) › Discursif › Pragmatique
QA ? › Trouver la réponse à une question › Extraction d’information = identifier l’information dans le contenu
› Plus facile si on balise ladite information -> microdata/rdfa
Les dessous de la recherche sémantique
QA = recherche de motifs et réécritures › Analyse de la requête (quel est <…> ? Quand <…> ?) › Extraction d’information lors de l’indexation (X est Y, X est né le Z)
Les dessous de la recherche sémantique
QA = recherche de motifs et réécritures › Analyse de la requête (quel est <…> ? Quand <…> ?) › Extraction d’information lors de l’indexation (X est Y, X est né le Z)
Le problème des ambiguïtés
Recherche ~ Index ~ chaînes de caractères › Homonymies › Tous les mots ne sont pas égaux (substantifs, verbes…) › Les entités nommées ont un rôle particulier
L’apport des entités nommées
Entités nommées › Objets textuels qui désignent une chose unique et précise du « monde réel »
› Personne, lieu, date, valeurs, entreprise…
Rôles d’« ancres sémantique » des requêtes › Besoin de reconnaître les entités dans les requêtes
› Base sémantique (RDF) : Freebase / Dbpedia…
› Knowledge graph !
Exemples d’usage du knowledge graph Identification de l’entité Paris (nom de lieu) : interrogation
d’une base de données structurées externe
Exemples d’usage du knowledge graph Identification de « Leonardo DiCaprio » comme une référence à
l’acteur > Extraction de la filmographie de l’acteur
Exemples d’usage du knowledge graph « Équipe de France » est une référence unique et précise à la sélection nationale de football (et tout un tas d’autres sports) > Utilisation du contexte de l’actualité pour sortir les résultats
de la coupe du monde
Exemples d’usage du knowledge graph « Nantes » est une (très jolie) ville > Extraction des principaux établissements situés à Nantes qui sont de type « restaurant »
Exemples d’usage du knowledge graph « x-men » est le nom d’une série de films dont un opus est à l’affiche en ce
moment et « Nantes » est une ville > Affichage des horaires des séances du dernier film X-Men dans les cinémas de Nantes
L’ambiguïté des entités nommées
Du texte à l’entité : même problème d’ambiguïté Besoin de contexte pour résoudre l’ambiguïté › Contexte dans la requête › Contexte dans l’historique de navigation, la géolocalisation…
L’ambiguïté des entités nommées
Avec du contexte Sans contexte
L’ambiguïté des entités nommées
Historique de recherche Navigation privée (avec géoloc)
Mais comment est-ce possible ?
Algorithmes connus (machine learning) … Mais besoin de (beaucoup) de données d’apprentissage
Base d’entités = Freebase
Géoloc. d’établissements = Google places
Données structurées = opendata + microformats
Apprentissage = votre clic sur le bon lien !
Contexte = n-grams extraits des pages et des livres (modèles de langue)
Mais comment est-ce possible ?
Satisfaire l’internaute Orange dans ses besoins de réponses immédiates pour le fidéliser
Sur Orange : l’enrichissement des résultats
CTR
= 30% !!
CTR
= 2%
2/ Comment Google façonne ces nouveaux usages
Impact SEM › Knowledge Graph / Answer Box / PLAs
› Réduction de l’espace des liens sponsorisés › Inflation de CPC dans un contexte de visibilité réduite en SEM
› L’invitation de Google a s’adapter à de nouveaux produits (PLA).
› Exemple du secteur hôtelier (destinations) › Le haut de page SEM est réduit à 1-2 annonceurs, la droite à 3 annonceurs. › Nouveaux produits Google: HPA (PLA); Google maps dans une moindre mesure. › Le SEO disparait du haut de l’écran ou « above the fold ».
SEM
SEM
Carte
Liens
en rapport
à la carte
HPA (Hotel
Product
Listing)
2/ Comment Google façonne ces nouveaux usages
HPA – PLA pour Hotels • Google met l’accent sur la comparaison de prix • Tentative de bypass de sites comme Tripadvisor • Le prix comme facteur du quality score donc du
calcul du CPC et de la position sur page Google change la donne en terme de visibilité des acteurs.
3/ S’adapter Evolution de la SERP par secteur: ex. le secteur hotelier (propriétés) ›Google facilite l’acces aux revues/ critiques et compare les prix ›Google propose ainsi une compétition directe avec des sites comme Tripadvisor ›Google met également en avant la fonctionnalité Maps et Google+
3/ S’adapter SERP sur le secteur aérien ›Google Flights: comparateurs de vols ›Compétition directe avec des sites comme Skyscanner, Kayak ou Expedia ›SEO disparait du haut d’écran
« Answer Box »
Quel est votre regard sur les « answer box » ? Comment pensez-vous que cela va évoluer ?
De la 9ème place à « l’answer box »
3/ Comment s’adapter à ces changements
de fond ?
S’adapter
Aidez Google à mieux comprendre vos contenus.
S’adapter
Rédactionnel Thématique Schema.org
• Born
• Date How old
• Height
• Tall How tall
• Size
• Dimension How big
3/ S’adapter
Contenu On-Page
Objectif : Créer des contenus dans le champ lexical de vos mots clés cibles
Optimisez pour une thématique.
Mot clé cible
Synonymes
Mots clés associés
Co-occurrence
Phrases usuelles
N-grams
3/ S’adapter > Schema.org
3/ S’adapter > Schema.org
Que peut-on décrire ?
~ 100 catégories au
départ
+ 1 200 aujourd’hui
3/ S’adapter > Schema.org
Le vocabulaire évolue rapidement
Sept. 2011
News
Nov. 2011
Annonces d’emploi
Novembre 2012
Ecommerce
Juin 2012
Santé et Medical
Publications Techniques
Août 2013
Service civil
Décembre 2013
Extension TV /
Radio
Février 2014
Sports
2011 2012 2013 2014
Rich Snippets > Events
3/ S’adapter > Schema.org Thing > Place > TouristAttraction
Thing > Place > LandmarksOrHistoricalBuildings
3/ S’adapter > Schema.org
Thing > CreativeWork > Series > Actors
3/ S’adapter > Schema.org
Demain
Mobile / Voice / Conversationnel
Thématique Être reconnu comme
une réponse Balisage Schema.org
Avant
Desktop Mot Clé Répétition
« simpliste » Balises Méta
3/ S’adapter
Réflexion sur une adaptation par device
Aujourd’hui
• Un rédacteur
• Un seul éditeur
• En 1er lieu pour le web
Demain
• Un rédacteur
• Plusieurs éditeurs
• Mieux « éditer l’usage »
titre de la présentation
Les micro-formats sont ils vraiment utilisés dans les sites web ? Vue de notre observatoire du web francophone
Type Nombre de
pages http://data-vocabulary.org/Breadcrumb 78 470 400
http://schema.org/MusicRecording 28 062 720
http://schema.org/VideoObject 27 659 520
http://schema.org/Person 25 440 000
http://schema.org/WebPage 24 084 480
http://schema.org/Article 21 335 040
http://schema.org/Product 19 703 040
http://schema.org/Blog 12 384 000
http://schema.org/Organization 12 138 240
http://schema.org/BlogPosting 11 089 920
http://schema.org/MusicPlaylist 10 801 920
http://data-vocabulary.org/Product 8 344 320
http://schema.org/LocalBusiness 6 608 640
http://data-vocabulary.org/Review-aggregate 6 182 400
http://schema.org/Book 6 028 800
http://schema.org/ImageObject 5 936 640
http://schema.org/MusicAlbum 4 308 480
3 formats en compétition : Microdata (Google, Bing, Yahoo, Yandex) RDFa (W3C) Microformats la famille des RDFA 15-16% des domaines, en augmentation (+2% en 2013-2014) la famille des microformats 6-7% des hosts, stagnation (en voie de disparition) la famille des micro-datas 8-9% des hosts, en augmentation (+2% en 2013-2014) principalement du schema.org
La position du moteur de recherche d’Orange : investir dans l’open data & sémantique
mettre en valeur les sites francophones à forte valeur ajoutée par leur micro-formats ouvrir notre observatoire du web avec des APIS pour inciter aux innovations Search mieux comprendre les questions complexes sur l’Assistance Orange, (notre mission première) avec l’analyse sémantique des requêtes
Conclusion
Les points à retenir
Changement des usages de recherches >
Mobile, vocal, conversationnel
Meilleure compréhension de la
requête > sens des mots + entités
nommées + contexte
Recherche de la réponse > formulations,
champ sémantique, schema.org
MERCI ! Questions / Réponses
top related