les technologies du web sémantique au service de l'open data · les technologies du web...

59
Les technologies du Web Sémantique au service de l'open data Raphael Troncy <[email protected] > Multimedia Semantics, EURECOM @rtroncy

Upload: others

Post on 10-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Les technologies du Web Sémantique au service

de l'open data

Raphael Troncy <[email protected]>

Multimedia Semantics, EURECOM @rtroncy

Page 2: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 2

Des changements importants : Production participative de données (Wikipedia)

… une pratique ancienne chez les botanistes ou les astronomes Des capteurs bon marchés (GPS, santé, énergie, etc.) Des partenariats publics / privés

Combien il y a de touristes sur les Champs Elysées ? Plusieurs manières pour quantifier un phénomène : transactions de

cartes de crédits, relevés téléphoniques, accès wifi, activités sur les réseaux sociaux (photos, tweets), etc.

Le monopole des données est fini → si vous n'ouvrez pas vos données, d'autres le feront à votre place

Big Data / Smart Data / Self Data / Linked Data

Page 3: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 3

openfoodfacts.org : base de données gratuites et ouvertes sur les produits alimentaires dans le monde

Page 4: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 4

openstreetmap.org : des données cartographiques crowd-sourcées et de la valeur ajoutée (e.g. escaliers ou ascenseurs pour l'accessibilité)

Page 5: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 5

BANO : base d'adresses constituées à partir de sources publiques (cadastre) et de production participative (crowdsourcing)

Page 6: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 6

geovelo : calculer votre itinéraire vélo dans de nombreuses villes en France

Page 7: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 7

marinetraffic.com : trafic maritime dans le monde entier

Page 8: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (participative)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 8

openmeteodata.org / meteo-parapente.com : prévisions météo

Page 9: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (self)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 9

Quantified self http://www.jawbone.com

Page 10: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (self)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 10

asthmapolis : capteur connecté d'inhalation de ventoline et réseau communautaire au service des asthmatiques (alerte, cartographies...)

Page 11: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (self)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 11

nest : domotique et thermostats connectés

Page 12: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (corporate)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 12

Page 13: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (corporate)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 13

Page 14: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

La production d'Open Data (institutionnel)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 14

http://www.data.gouv.fr/

Page 15: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - - 15 2ème Séminaire Open Data en Agriculture - Paris

Page 16: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Quels sont les problèmes ?

Le mouvement d'ouverture des données

● Redondance des identifiants

● Hétérogénéité des formats de données

● Diversité des vocabulaires de métadonnées

● Hétérogénéité des protocoles d'accès

07/01/2015 - - 16 2ème Séminaire Open Data en Agriculture - Paris

Page 17: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Hypothèses

Le Web sémantique comme solution

● Un système d'identifiants global: les URI

● Un format unique: RDF

● Un langage de représentation de vocabulaires de métadonnées RDFS+OWL, SKOS

● Un protocole d'accès uniforme HTTP, SPARQL

07/01/2015 - - 17 2ème Séminaire Open Data en Agriculture - Paris

Page 18: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Le Web 3.0 par Kate Ray (~2010)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 18

Page 19: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 19

Le puzzle du Web ...

HTTP/D

URL - URI HTML

Page 20: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 20

Query SPARQL

XPath Xpointer

XLink

annotations

RDF

ontologies

RD

FS

OW

L

… augmenté d'une couche de sémantique

DTD - XML Schema

HTTP/D

URL - URI XML

HTML XSL/T

XQuery

règles

inférences

Page 21: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 21

Quelques définitions

“The Semantic Web is an evolving development of the World Wide Web in which the meaning (semantics) of information and services on the web is defined, making it possible for the web to "understand" and satisfy the requests of people and machines to use the web content.”

“It derives from World Wide Web Consortium director Sir Tim Berners-Lee's vision of the Web as a universal medium for data, information, and knowledge exchange”

Page 22: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 22

Quelques définitions

“The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries. It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners.”

Page 23: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 23

La Vision de TimBL dès 1994

Page 24: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Les données structurées dans le

Page 25: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

RDF est le modèle de données permettant d’encoder les descriptions

( sujet , prédicat , objet )

Page 27: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Pizza de Tiphaine est une recette de pizza Pizza de Tiphaine a pour ingrédient tomate Pizza de Tiphaine a pour ingrédient mozzarella Pizza de Tiphaine a pour ingrédient champignon Pizza de Tiphaine est dans la catégorie facile Pizza de Tiphaine se prépare en 20 min

Une description plus formelle :

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 28: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Oui mais… comment exprimer de façon

non-ambigüe ces descriptions ?

« a pour ingrédient », « contient », « has ingredient »… ?

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 29: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

En utilisant une interprétation commune des descriptions qui s’appuie sur des

Vocabulaires partagés Autrement appelés

Ontologies Qui déterminent un sens univoque aux verbes, aux catégories de sujet et aux compléments

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 30: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

ex:pizza23 rdf:type recette de pizza ex:pizza23 food:hasIngredient tomate ex:pizza23 food:hasIngredient mozzarella ex:pizza23 food:hasIngredient champignon ex:pizza23 dc:subject myData:easy ex:pizza23 schema:cookingTime 20 min ex:pizza23 rdfs:label "Pizza de Tiphaine"

Une description plus formelle …

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 31: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

… permet de répondre à des questions plus formelles

?truc rdf:type recette de pizza ?truc schema:cookingTime < 20 min ?truc dc:subject végétarienne

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 33: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Grâce à des URIs

http://mydomain.org/mypath/myresource

Page 34: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

URL identifier ce qui existe sur le web

http://mon.site.fr

URI identifier,

sur le web, ce qui existe

http://animaux.fr/mon-zebre

Fabien Gandon : http://fr.slideshare.net/fabien_gandon

Page 35: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

http://exemple.com/Elvis joue de la guitare

http://exemple.com/Elvis habite à Las Vegas

Des données peuvent

parler du même « sujet » que d’autres données

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 36: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Des données peuvent

utiliser en « complément » un sujet d’autres données

http://data.insee.fr/Paris est en France

Elvis est en concert à http://data.insee.fr/Paris

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 37: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

http://exemple.fr/rencontre est une propriété (qui relie 2 personnes)

Thomas http://exemple.fr/rencontre

Olivier

Des données peuvent

utiliser un « verbe » défini dans d’autres données

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 38: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Open Data et Web de données

★ Données accessibles sur le web (sans conditions de formats) ★★ Données accessibles structurées (Excel au lieu de l’image d’un tableau) ★★★ Formats non-propriétaires (exemple: csv au lieu d’Excel) ★★★★ Utiliser des URI pour identifier les ressources ★★★★★ Relier les données à d’autres données

http://5stardata.info/

Page 39: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

et

Page 40: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein

Page 41: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Interroger DBPedia • http://fr.dbpedia.org/sparql • SPARQL : le langage d’interrogation

des données en RDF

Page 42: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Les entreprises avec leur nom…

SELECT ?x ?label

WHERE {

?x rdf:type dbpedia-owl:Company .

?x rdfs:label ?label

FILTER(lang(?label) = "fr")

}

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 43: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Les villes d’Indre-et-loire

SELECT ?ville ?insee ?habitants

WHERE {

?ville dbpedia-owl:geolocDepartment dbpedia-fr:Indre-et-Loire .

OPTIONAL { ?ville prop-fr:insee ?insee }

?ville dbpedia-owl:populationTotal ?habitants .

} ORDER BY DESC(?habitants)

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 44: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Les entreprises implantées dans une ville d’indre-et-loire

SELECT ?nomEntreprise ?nomVille WHERE { ?entreprise dbpedia-owl:locationCity ?ville . ?ville dbpedia-owl:geolocDepartment dbpedia-

fr:Indre-et-Loire . ?entreprise rdfs:label ?nomEntreprise . ?ville rdfs:label ?nomVille . FILTER(lang(?nomEntreprise) = 'fr' &&

lang(?nomVille) = 'fr') . }

Thomas Francart : http://fr.slideshare.net/thomasfrancart/partager-et-rutiliser-des-donnes-sur-le-web

Page 45: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia
Page 46: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

data.bnf.fr

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 46

Exemple : http://data.bnf.fr/11928016/jules_verne/ http://data.bnf.fr/12008369/jean_de_la_fontaine_fables/ http://data.bnf.fr/ark:/12148/cb12650268p (ornithologie)

Page 47: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

datos.bne.es (http://linkeddata3.dia.fi.upm.es/bne-demo/)

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 47

Page 48: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

data.europeana.eu

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 48

Showcase: http://remix.europeana.eu/

Page 49: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Government Linked Data

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 49

•data.gov.uk •data.gov •dados.gov.br •data.gouv.fr •overheid.nl •digitaliser.dk •…

Page 50: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

but de datalift

De données brutes ouvertes à des données sémantiques

interconnectées

07/01/2015 - - 50 2ème Séminaire Open Data en Agriculture - Paris

Page 51: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Datalift

● Plateforme logicielle pour assister la publication de données

● Publication de jeux de données ● R&D pour automatiser le processus de publication ● Formations, tutoriels, camps de publication de

données

07/01/2015 - - 51 2ème Séminaire Open Data en Agriculture - Paris

Page 52: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 52

Page 53: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Perfect School

App: http://semantics.eurecom.fr/datalift/PerfectSchool/

Dataset: https://www.data.gouv.fr/fr/organization/datalift

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 53

Page 54: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Visualizing Equipment in Toulouse

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 54

Page 55: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Datalift : Rejoignez l'association !

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 55

https://www.youtube.com/watch?v=2YxAk89m0Hc

Page 56: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

y p y Platform for City Exploration Finalista per il premio “Smart Communities@SMAU Anthony Jameson, DFKI (Activity Lead)

22 ottobre 2014

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 56

Beyond Maps: 3cixty, a New Platform for City Exploration

https://www.3cixty.com/

Page 57: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 57

http://www.appsforeurope.eu/

Page 58: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Conclusion

Le Web de Données au service de l'open data Un modèle de données orienté graphes qui se prête naturellement à

l'interconnexion Un catalogage des vocabulaires multilingues bien conçus Un langage de requêtes expressif et un protocole d'accès

autorisant la fédération

Le domaine geo-spatial en plein boom W3C and OGC to Collaborate to Integrate Spatial Data on the Web

http://www.w3.org/blog/news/archives/4287

Le Web Sémantique dans l'Internet des objets, les villes intelligentes

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 58

“A little data lifted goes a long way”

Page 59: Les technologies du Web Sémantique au service de l'open data · Les technologies du Web Sémantique au service de l'open data Raphael Troncy  Multimedia

Credits

07/01/2015 - 2ème Séminaire Open Data en Agriculture - Paris - 59

http://fabien.info/

http://www.sparna.fr/

http://fing.org/?_Charles-Nepote_