finlands nationalbibliografi som länkad data 2018/finlands nationalbibliograf… · ämnesbaserad...
TRANSCRIPT
Om mig Osma SuominenSystemspecialist, Nationalbiblioteket i Finland
Doktorsavhandling “Methods for Building Semantic Portals”Semantic Computing Research Group, Aalto-universitetet, 2013
Inledde mitt arbete på Nationalbiblioteket 2013med att bygga upp tesaurus- och ontologiservicen Finto.fi
Jobbar med att utveckla bibliografisk länkad data (Fennica-LD) samt med automatisk innehållsbeskrivning (Annif)
Programvaruprojekt med öppen källkod t.ex.Skosify - Validation and QA tool for SKOS vocabulariesSkosmos - SKOS vocabulary publishing toolAnnif - Tool for automated subject indexing and classification
Twitter: @OsmaSuominen
LinkedIn:osmasuominen
GitHub:@osma
Finlands nationalbibliografi FennicaInnehåller metadata om:
● finländska böcker från och med 1488● periodiska publikationer, bl.a. tidningar, från och med 1771● kartor från och med 1540-talet● audiovisuella material● digitaliserade gamla material● ämnesbaserad katalog över småtryck, bl.a. reklam och visitkort● katalog över tematiska webbinsamlingar från och med 2008● förlagens förhandsinformation om kommande publikationer● utvalda e-böcker från och med 2008.
Fennica innehäller inte:● musik (katalogiseras i nationaldiskografin Viola)● artiklar (katalogiseras i artikeldatabasen Arto)
Melindasamkatalog
Fennica
Ex Libris Aleph ILS
Nationalsamlingen
Fennica är samtidigt en katalog över nationalsamlingen, som är en arkivsamling över den nationella publikationsproduktionen.
Nationalsamlingen innehåller tryckt material från början av 1800-talet fram till dags dato.
I Nationalsamlingen ingår dessutom utländskt material som är finskspråkigt, publicerat av finländare eller som handlar om Finland (s.k. utlandsfennica).
Fennica
Finna.fi
Sökmotor för material i Finlands museum, arkiv och bibliotek+ reservation, lånefunktioner ...
Fennica-LDdata.nationallibrary.fi
Fennica publicerat som länkad data
Varför skapa Fennica-LD?
1. Göra bibligrafisk data mer synligt, också internationellt
2. Förbättra kvaliteten och interoperabiliteten
3. Lära oss om nya metoder och teknologier
4. Varför inte? :)
Fennica-LD vs. Libris XLFennica-LD Libris XL
Syfte Konvertering av finska nationalbibliografin till länkad data samt publicering av sultresultatet i hanterbar form
Samkatalog för hantering av bibliografisk metadata
Originalformat för metadata MARC21 BIBFRAME / JSON-LD
Datamodell Schema.org-baserad BIBFRAME-baserad
Exportformat Olika RDF-format (RDF/XML, Turtle, N-Triples, JSON-LD, HDT)
JSON-LD, MARC
Användargränssnitt data.nationallibrary.fi Endast internt bruk
Driftstatus Experimentell drift sedan 12/2017 I produktion sedan 7/2018
bib record
bib record
bib record
bib record
auth record
auth record
auth record
bib record
bib record
auth record
auth record
auth record
1M bib records 125k person names
40k corporate names
35k subjects (YSA)bib record
bib record
bib record
bib record
bib record
bib record
auth record
auth record
auth record
bib record
bib record
auth record
auth record
auth record
Work
Instance
Person
Subject1M bib records 125k person names
40k corporate names
35k subjects (YSA)bib record
bib record
Place
Organization
Work
Instance
Person Subject
Image credit: MaryMaking blog
bib record
bib record
bib record
bib record
auth record
auth record
auth record
bib record
bib record
auth record
auth record
auth record
125k person names
40k corporate names
35k subjects (YSA)bib record
bib record
1M bib records
As seen in:
SWIB16 talk
DCMI webinar
o-bib journal article
“From MARC silos to Linked Data silos”
med Verk och Instanser såsom i BIBFRAME
för att beskriva våra entiteter från ett webbfokuserat slutanvändarperspektiv
Special thanks to Richard Wallisfor help with applying schema.org!
MARCXML
BIBFRAME RDF
Schema.org RDF
Linked to external URIs
MARC / Aleph seq
With deduplicated works
Work keys
With deduplicated agents
Agent keys
Convert &clean usingCatmandu
Convert usingmarc2bibframe2
Convert to Schema.org using SPARQL CONSTRUCT
YSA subjects
YSO subjects
Corporate names
RDA Media, Content, Carrier
Link against controlled vocabularies using SPARQL
Generate work keysfor merging using SPARQL
Merge worksusing SPARQL
Merge agents(person, org)using SPARQL
RDFstore
https://github.com/NatLibFi/bib-rdf-pipeline
Data dump downloads
Publicering som länkade data (och MARC)både för människor och för maskinerunder CC0-licens
RDFHDT
Jena Fuseki
bib-lod-uiFlask app
HTML+JSON-LD
OpenSearch API
Linked Data RDFRDFstore
RDFN-Triples
MARCrecords Linked Data
Fragmentsserver
SPARQL
LDF
Demohttp://data.nationallibrary.fi/bib/me/W00002848700
Identitetshantering
Bibliotek har traditionellt hanterat identiteter (t.ex. personer, verk, orter, ämnen) med auktoriserade namnformer - strängar
Strängar är problematiska. Det skulle vara bättre att ha stabila identifikatorer i stället. Det gör man oftast inte i MARC.
Vi har ganska många dubbletter (mest personer och verk) i Fennica-LD:● vet inte alltid om två personer med samma namn är på riktigt samma person● ett svårt problem att identifiera verk från traditionella bibliografiska poster
Detta torde vara lättare i Libris XL, eftersom ni jobbar med länkade entiteter.
“Cool URIs don’t change” -- Tim Berners-Lee
...men vi konverterar om och om MARC-poster, som ändras hela tiden!
Work
Instance
Person
Subject
Place
Organization
LCSH
Finnish Place Name Registry
Wikidata
WorldCat
Other nationallibraries
WorldCat Works
LIBRIS XL?
ISNI
VIAF ISNI
Wikidata
SPARQL-gränssnitt http://data.nationallibrary.fi/bib/sparql
FennicaTrends visualiseringsverktyg utvecklat i WIDE hackathon
Framtida steg1. Berikning och städning av RDF-data, t.ex. mer specifika klasser såsom Map
2. Vidareutveckling av verksbeskrivningar och extraktion av verk
3. Djupare sammankoppling till andra länkade dataset
4. Utvidgning till andra kataloger: diskografin Viola, artikeldatabasen Arto
Tack så [email protected] - @OsmaSuominen
http://data.nationallibrary.fi - @NatLibFiData
Öppen källkod:https://github.com/NatLibFi/bib-rdf-pipeline
https://github.com/NatLibFi/bib-lod-ui
Denna presentation: http://tinyurl.com/fennica-ld-kb