groupe normes & standards doi - sne.fr · vocabulary mapping framework (vmf) : dictionnaire de...

49
Groupe Normes & Standards DOI Digital Object Identifier SNE COMMISSION NUMERIQUE 2014-2015 http://www.sne.fr/enjeux/n ormes-et-standards/ Présentation réalisée le 10/03/2015 par Catherine Kempeneers (Foucher), Edern Rio (Sofedis), et Laurence Zaysser (Sejer-Editis) dans le cadre de l’atelier « Identifiants : ISBN, ISTC, ISNI et quelques autres ».

Upload: phamanh

Post on 15-Sep-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

Groupe Normes & Standards

DOIDigital Object IdentifierSNE

COMMISSION NUMERIQUE

2014-2015

http://www.sne.fr/enjeux/normes-et-standards/ Présentation réalisée le 10/03/2015 par

Catherine Kempeneers (Foucher), Edern Rio (Sofedis), et Laurence Zaysser (Sejer-Editis)dans le cadre de l’atelier « Identifiants : ISBN, ISTC, ISNI et quelques autres ».

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 2

Introduction1996

◦ Initiateurs

◦ AAP, IPA, ISTM

Besoins◦ Identifier une ressource numérique (distincte du papier)>> Identification

unique et pérenne d'une ressource accessible sur les réseaux numériques

◦ Informer sur les droits d’utilisation de la ressource numérique (métadonnées)>> Chaîne de distribution numérique

◦ besoin d'un équivalent du code-barre analogique : identification d'un contenu analogique migrant vers un contenu numérique en réseau

◦ ne peut reposer sur une URL >> liens brisés ou morts, "404 not found", URL orphelines, obsolètes (quand imprimées par ex...)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 3

IntroductionEnjeux multiples pour acteurs multiples

◦ Acteurs et instances du monde de la recherche, éditeurs scientifiques : obligation de citation des sources et où sources disponibles sous forme numérique, en ligne (avec / sans publication papier)

◦ Bases de données bibliographiques, scientifiques, statistiques...

◦ Catalogues de ressources en ligne (éducation)

◦ Acteurs privés : ex. : obligation des laboratoires pharmaceutiques de citer les études scientifiques pour l'agrément de médicaments

◦ Limitation des DNS gérés par l’ICANN

◦ Localisations multiples (plusieurs URL) pour un même contenu

◦ Métadonnées pour la valorisation des données en ligne

◦ …

Ouverture progressive à différents contextes d'applications et types de contenu : industries culturelles, éducation, etc.>> convergence numérique

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 4

Introduction1997-1998

◦ Création de l’IDF (International DOI Foundation)

◦ Mission >> développer le Digital Object Identifier (system) ®

◦ 2000 : lancement de la première application DOI par Crossref (>>citer et relier entre eux, à tous les niveaux de granularité souhaités, des types d’objets numériques très différents), DOI standard NISO

Août 2003 : 10 millions de DOI

2005 : révision légère de la norme

2012 : norme ISO26324:2012, Information et documentation – Système d'identifiant numérique d'objet

Novembre 2014 : 100 millions de DOI

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 5

IntroductionLe DOI en bref

◦ Identifiant unique et pérenne d'un « objet » (= entité qui peut être numérique, physique ou abstraite)

◦ Indépendant de la / des localisation(s), permettant de récupérer la dernière localisation (si elle change) et de gérer plusieurs localisations

◦ Métadonnées associées à l’objet◦ Interopérabilité avec différentes applications et différents standards et normes

(autres identifiants, autres schémas de métadonnées, par ex.)◦ Intégrable dans application (web/maison)◦ Infrastructure commune

◦ Technique : structure logicielle, résolution, modèle de données

◦ Sociale : superviser les obligations des agences d'enregistrement (obligation de pérennité, etc.)

◦ Technologie et modèles de données existants◦ Handle System ®

◦ Vocabulary Mapping Framework (VMF) : dictionnaire de données/répertoire de métadonnées (initialement: indecs)

DOI est une marque déposée par l'International DOI Foundation (IDF)

Quoi?• OBJET RÉFÉRENT & RÉFÉRÉ

• GRAIN DE L’OBJET

• URL DE L’OBJET

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 6

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 7

Quoi – DOI objectRéférent -> référé (réalité)comme en linguistique

Objet référent = DOI object (id + méta)

Objet référé totalement libre

Dans l’absolu, trois types de référés potentiels◦ Objet numérique : ressource numérique en ligne ou téléchargeable [version

initiale du DOI], ressource textuelle/multimédia (image, vidéo, audio)

◦ Objet physique : ressource numérique sur support physique (DVD, clef USB, carte mémoire), publication papier, entité du monde réel (personne, pays, entreprise)

◦ Objet abstrait : œuvre de l’esprit (hors manifestation), texte juridique, concept dans un graphe sémantique

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 8

Quoi – Grain de l’objetTotalement libre, à la convenance du déclarant

Exemple presse◦ Un titre de périodique◦ Un numéro de périodique◦ Un article dans un titre de périodique

Exemple littérature◦ Un roman◦ Un chapitre du roman◦ Un paragraphe du roman◦ Une image du roman

Exemple juridique◦ Un texte de loi◦ Un article de loi◦ Un alinéa dans un article de loi

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 9

Quoi – URL de l’objetATTENTION ! Ne pas confondre objet référé et URL de l’objet

◦ Soit équivalent : uniquement dans le cas des ressources numériques en ligne [à l’origine]

◦ Soit différent : dans tous les autres cas ! [extension d’usage]

Référé numérique◦ Référé = ressource numérique en ligne

=> URL de la ressource gratuite=> URL de la ressource en accès restreint autorisé=> URL du site de vente de la ressource payante

◦ Référé = ressource numérique téléchargeable (eBook, application fixe, application mobile)=> URL du site de page de téléchargement de la ressource gratuite=> URL du site de vente de la ressource payante

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 10

Quoi – URL de l’objetRéféré physique

◦ Référé = ressource numérique sur support physique (DVD, clef USB, carte mémoire)=> URL du site de vente de la ressource payante

◦ Référé = publication papier=> URL du site de vente du livre

◦ Référé = entité du monde réel (personne, pays, entreprise)=> Soit URL = page de définition de cette entité (type wiki)=> Soit URL = page dynamique définissant l’entité par exposition des métadonnées du DOI record

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 11

Quoi – URL de l’objetRéféré abstrait

◦ Référé = œuvre de l’esprit (hors manifestation), texte juridique=> Soit URL = page de définition de cette entité (type wiki)=> Soit URL = page dynamique définissant l’entité par exposition des métadonnées du DOI

◦ Référé = concept dans un graphe sémantique (ontologie web 3.0)=> Soit URL = page de définition de cette entité (type wiki)=> Soit URL = page dynamique définissant l’entité par exposition des informations du graphe sémantique=> Soit URL = page dynamique définissant l’entité par exposition des métadonnées du DOI

Par qui ?• ACTEURS DE LA DÉFINITION DU DOI

• ACTEURS DE L’ENREGISTREMENT DANS APPLICATIONS DOI

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 12

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 13

Acteurs de la définition du DOIIDF : association à but non lucratif financée par ses membres (en majorité agences d'enregistrement)◦ Supervise la Fédération des agences d'enregistrement et

de services DOI

◦ Autorité qui définit et « maintient » le DOI system (standard ISO, nouveaux champs d'usage, etc.)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 14

Acteurs de l’enregistrement dans applications DOI

Les agences d'enregistrement

Membres de l'IDF, mais autonomes et indépendantes

Rôle principal : ◦ Attribution des préfixes de DOI

◦ Enregistrement des DOI

◦ Implémentation du DOI system◦ Mise à disposition des déclarants de l'infrastructure nécessaire permettant la déclaration et le

suivi des données et métadonnées

Peuvent proposer leurs propres services associés

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 15

Comment ?• D O I SY ST E M

• D O I N A M E

• D O I R ECO R D

• D O I M E TA DATA

• D O I R ES O LU T I ON

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 16

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 17

Système DOIUne boite à outils générique prête à l’emploiNB : avec différentes applications existantes & possibles

Données (cf. DOI record)◦ Identifiant (cf. DOI name)

◦ Métadonnées (cf. DOI dataset)

Architecture & services informatiques

◦au standard (= sa définition + une partie de son implémentation)Protocoles de communication entre composants informatiques, modalités de résolution de DOI, métadonnées minimum à offrir, freeware client Handle

◦au standard (= son usage + le reste de son implémentation)DOI application pour un contexte d’usage (CrossRef, DataCite, …)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 18

Système DOI

Demande d’enregistrement

- DOI name suffixe- DOI metadonnées

Service Résolution de DOI

de l’agence d’enregistrement

Service utilisateur

Base de données de l’agence

d’enregistrement- DOI records

Fournisseur d’objet

Comment ?DOI NAME

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 19

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 20

DOI name - FonctionIdentifiant unique et pérenne

Distingué de sa/ses localisation(s)

Identifie un objet (cf. référent- - - >référé)◦ De nature quelconque

◦ Différenciable des autres objets de même nature dans la base de données grâce à ses métadonnées NB : l’identifiant n’en est que la conséquence !...

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 21

DOI name – SyntaxeComposé de deux parties séparées par barre oblique

◦ Préfixe : composé de deux sous-parties séparées par point◦ Handle DOI (vaut toujours 10) – distinct d’autres Handles

◦ Identifiant du déclarantPeut être lui-même décomposé en sous-divisions séparées par un point, afin de rendre compte de la hiérarchie de la structure déclarante (groupe / maison d’édition / marque)

◦ Suffixe : identifiant unique de l’objet référé choisi par le déclarant (sans limitation de longueur)◦ N’importe quel caractère alphanumérique utf-8

◦ N’importe quelle longueur (=> DOI names en nombre ∞)

Ex :

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 22

DOI name – Relation aux autres identifiantsPeut contenir un identifiant existant (ISAN, ISBN, ISRC, ISSN, ISTC, ISNI)

◦ ISBN : incorporation des éléments composant un ISBN dans le préfixe + suffixeEx : 10.978.86123/45678 ISBN = 978-86-123-4567-8

◦ ISSN : mis dans le préfixe du DOI, préfixé par « issn. » Ex : 10.1038/issn.1476-4687

◦ Intéressant pour◦ Garder trace d’identifiant préexistant

◦ Faire coexister les deux identifiants et les mettre en relation

◦ Ne pas réinventer la roue (défi de garantie d’unicité et de pérennité d’identifiant)

Spécificités du DOI◦ Peut désigner absolument ce qu’on veut (pas seulement une publication

commerciale)◦ Suffixe auto-attribué◦ Nombre infini de valeurs◦ Peut contenir des caractères alphabétiques (hors ANSI de surcroit)◦ Métadonnées discriminantes associées à l’identifiant explicites

Comment ?DOI RECORD

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 23

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 24

DOI recordObjet complexe dans une base de données (record = enregistrement)

Objet auto-descriptif◦ Identifiant (cf. DOI name) – clef d’accès unique

◦ Informations associées (cf. dataset des métadonnées)◦ Champs + valeurs de champ

(couples attribut-valeur)

Comment ?DOI METADATA

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 25

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 26

Métadonnées - ModèleDéfini pour

◦ Humains et machines

◦ Entité reconnaissable par propriétés discriminantes

◦ Qualité et un service minimum (champs obligatoires, valeurs contrôlées par des vocabulaires)

◦ Interopérabilité entre agences d’enregistrement (cf. indecs = interoperability of data in e-commerce systems)

Défini par◦ IDF pour les métadonnées noyau

Sous la forme XSD (XML Schema Definition), évolutif & versionné (v 2.2)En deux parties DOI Kernel XML Schema + Allowed Value Sets (AVS)

◦ Autres organismes de normalisation pour les métadonnées étendant le modèle DOI

◦ Agences d’enregistrement pour les métadonnées spécificiques à 1 application

Comprend 1 noyau (kernel) extensible (champs et valeurs de champs) pour les besoins des différentes applications DOI

◦ Extension DataCite (cf. DataCite Metadata Schema v 3.1)

◦ Extension CrossRef (cf. crossref4.3.0.xsd)

◦ … (le futur est à inventer !)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 27

Métadonnées – Modèle noyauMétadonnées de description du référé

◦ Identifiant(s) – dont DOI name, mais aussi ISAN, ISBN, ISRC, ISSN, ISTC, ISNI

◦ Libellé(s) avec multilinguisme grâce à attribut @lang

◦ Type(s) de référé

◦ Modalité(s) sensorielle(s) [sic]

◦ Date de naissance/création

◦ Date de mort

Métadonnées de gestion des métadonnées◦ Agence d’enregistrement

◦ Date création du DOI name

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 28

Métadonnées - PeuplementRenseignées par

◦ Le fournisseur de l’entité référée

◦ Avec l’aide de l’agence d’enregistrement

◦ Dans la base de données de l’agence d’enregistrement

◦ Soit saisie manuelle via une interface webEx: https://doi.crossref.org/servlet/useragent?func=showHome

◦ Soit import en masse d’un existantGrâce mapping modèle DOI <-> modèle existant (CIDOC CRM, DCMI, DDEX, FRBR, MARC21, LOM, ONIX, RDA)

Mises à jour par◦ Le fournisseur de l’entité référée

◦ Sauf si délégation à l’agence d’enregistrement

Comment ?DOI RESOLUTION

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 29

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 30

Résolution - DéfinitionProcédé qui retourne une/des information(s) lorsqu’on interroge un DOI

Résolution simple : renvoie 1 URL

Résolution multiple : renvoie 1-N informations (cf. dataset)◦ A minima, l’URL préférentielle

NB : au choix du fournisseur de l’entitéEx 1 : notice bibliographique de la ressource sur le site de la maison d’édition (=> trafic sur le site)Ex 2 : la ressource en ligne directement accessible (=> confort lecteur)Ex 3 : page dynamique contenant les métadonnées (=> fraicheur info)

◦ Les autres informations disponibles◦ Les autres URLs, si localisations multiples

Ex : l’ensemble des sites revendeurs de la ressource (=> compte client chez revendeur)

◦ Les métadonnées décrivant l’objet

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 31

Résolution simple – 1 URL

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 32

Résolution multiple – N URLs

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 33

Résolution multiple –N métadonnées

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 34

Résolution multiple –N métadonnées

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 35

Résolution multiple –N métadonnées Au format JSON (cf. Handle DOI system Proxy Server REST API)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 36

Résolution multiple –N métadonnéesà la convenance de l’intégrateur en fait

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 37

Résolution – Requête sur DOIClient humain/machine qui fait son marché dans la BD DOI et détermine la/les informations qu’il souhaite récupérer

Quatre modalités d’appel pour la résolution de DOI

Soit recherche depuis un client web◦ Via la barre d’adresse de son navigateur après installation d’un plug-in (DOI resolver)

◦ “DOI Resolver” pour Chrome ; “CNRI Handle Extension for Firefox”

◦ Référence : doi:10:123/456

◦ Via un « DOI link », hyperlien cliquable depuis une page web◦ Référence : <a @href="http://doi.org/10.123/456">doi:10:123/456</>

◦ Via une application DOI d’agence et son service de recherche de DOI◦ Medra, CrossRef, DataCite, EIDR, …

◦ Référence : 10:123/456

Soit recherche depuis une application maison◦ Intégrant un service de recherche de DOI (exclusivement ou pas)

◦ Référence : 10:123/456

◦ Implémenté par intégration du Handle system client (freeware, disponible en C & Java) – à faire par les développeurs de l’application maison

NB : dans tous les cas, la résolution se fait grâce au DOI Handle

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 38

Résolution – Requête sur DOI

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 39

Résolution – Requête sans DOI nameGrâce aux métadonnées

Cas d’utilisation

Kempeneers, Rio, Zaysser SNE - Commission normes & standards 10/03/2015 40

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 41

I. Choisir son agence d’enregistrement• Contact avec organisme habilité à attribuer des préfixes DOI, membre d'une

agence d'enregistrement ◦ Par exemple en France : INIST-CNRS (DataCite), Cléo (Crossref)…

Chacune a des métadonnées obligatoires différentes

Applications DOI n’offrent pas les mêmes services

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 42

L’agence des éditeurs universitaires et des revuesObjectif : Permettre la citation et l’accès de manière persistente aux articles de recherche.

• 72 millions d’articles de périodiques et d’autres contenus (chapitres de livre, données, thèses, rapports techniques) référencés

• Revues.org travaille avec eux comme de près de 6000 éditeurs universitaires, professionnels ouscolaires, dont Reed Elsevier, Wiley, etc.

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 43

Services Cross ref :

• CrossRef Metadata Services : Permet d’améliorer le référencement des titres

• Crosscheck : outil de lutte contre le plagiat dans les articles de recherche

• Cited by linking : outil pour suivre les citations de tiers vers ses articles.

Obligations des éditeur qui utilisent Crossref :

• Publier des textes scolaires de première main et que ceux-ci soient accessible en ligne (?)

• Fournir les métadonnées, s’engager à les maintenir à jour ainsi que les url de destination

• Payer les honoraires de Crossref

L’agence des éditeurs universitaires et des revues

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 44

Donner accès aux données de la rechercheObjectif : rendre accessible les données brutes de la recherche afin d’accélérer la construction de nouvelles connaissances scientifiques. Le manque d’accessibilité de ces données est souvent un obstacle à la recherche internationale.

• Avantage : INIST (Institut de l’information scientifique et technique) est membre du consortium

• Inconvénient : ne semble pas très adapté au monde de l’édition

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 45

L’agence européenne des association d’éditeur mEdra semble être la plus adapté pour l’édition « trade »

• Pas de spécialisation apparente

• AIE (Associazone Italiana Editori) est un membre fondateur qui héberge le bureau des ventes de mEDRA.

• MVB, filiale économique de la Börsenverein (groupement de professionnels du livre allemand, organisateur de la foire de Francfort) est partenaire

• A développé en partenariat avec EDItEUR le schéma ONIX officiel pour l’enregistrement des DOI

• Gère les métadonnées DOI selon la syntaxe ONIX

• Participe à ELEONET (European Learning Object Network)

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 46

II. Créer un compte (mEDRA)Demander la création d’un compte

Passer contrat avec l’agence

Attribution d’un préfixe DOI DOI Bracket Annual Fee

HTDOIs included Price per unit

for exceeding DOIs (HT)

0 150 25 4.50

1 400 85 3.80

2 600 170 2.70

3 900 350 2.00

4 1,350 650 1.60

5 2,000 1,300 1.10

6 3,000 2,550 0.90

7 4,500 5,000 0.65Tari

fs m

EDR

A

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 47

III. Mettre en place sa politique DOIDétermination de la syntaxe de ses suffixes DOI

Prendre connaissance du ONIX DOI Metadata Schema et définir les objets qui seront enregistrés.

◦ DOI à un niveau œuvre (objet abstrait) ou manifestation (imprimé, pdf, epub, html…)

◦ Monographies en tant qu’œuvre ou manifestation

◦ Chapitres pour œuvre ou manifestation

◦ Serial title, serial issue, serial article…

Déterminer la forme de ses DOI Records. Comment se résoudront-ils ?

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 48

IV. Mettre en place ses process(mEDRA)

• Les agences fournissent souvent des environnements de test (enregistrement temporaire des DOI et vérifications de compatibilité avec workflows internes)

3 manières d’enregister ses DOI :◦ Upload fichier xml

◦ Formulaire (monographie et serial article)

◦ Par webservice

Prévoir des process de mise à jour des métadonnées car ceci est à la charge du déclarant

Kempeneers, Rio, Zaysser SNE – GROUPE NORMES & STANDARDS 10/03/2015 49

WebographieDOI Handbook : http://www.doi.org/hb.html

DOI Metadata Kernel Schemahttp://www.doi.org/doi_handbook/DOI_Schema_Release_Notes.html

DOI wiki : http://fr.wikipedia.org/wiki/Digital_Object_Identifier

ISO 28324 : http://www.iso.org/iso/fr/catalogue_detail?csnumber=43506

INIST :

http://www.inist.fr/?Attribution-de-DOI

CrossRef How to ? http://fr.slideshare.net/CrossRef/crossref-howto-a-technical-introduction-to-the-basics-of-crossref-chuck-koscher