finlands nationalbibliografi som länkad data 2018/finlands nationalbibliograf… · ämnesbaserad...

31
Finlands nationalbibliografi som länkad data Osma Suominen Libris användardag, 5.12.2018

Upload: others

Post on 30-Nov-2019

6 views

Category:

Documents


0 download

TRANSCRIPT

Finlands nationalbibliografisom länkad data

Osma Suominen

Libris användardag, 5.12.2018

Om mig Osma SuominenSystemspecialist, Nationalbiblioteket i Finland

Doktorsavhandling “Methods for Building Semantic Portals”Semantic Computing Research Group, Aalto-universitetet, 2013

Inledde mitt arbete på Nationalbiblioteket 2013med att bygga upp tesaurus- och ontologiservicen Finto.fi

Jobbar med att utveckla bibliografisk länkad data (Fennica-LD) samt med automatisk innehållsbeskrivning (Annif)

Programvaruprojekt med öppen källkod t.ex.Skosify - Validation and QA tool for SKOS vocabulariesSkosmos - SKOS vocabulary publishing toolAnnif - Tool for automated subject indexing and classification

Twitter: @OsmaSuominen

LinkedIn:osmasuominen

GitHub:@osma

Finlands nationalbibliografi FennicaInnehåller metadata om:

● finländska böcker från och med 1488● periodiska publikationer, bl.a. tidningar, från och med 1771● kartor från och med 1540-talet● audiovisuella material● digitaliserade gamla material● ämnesbaserad katalog över småtryck, bl.a. reklam och visitkort● katalog över tematiska webbinsamlingar från och med 2008● förlagens förhandsinformation om kommande publikationer● utvalda e-böcker från och med 2008.

Fennica innehäller inte:● musik (katalogiseras i nationaldiskografin Viola)● artiklar (katalogiseras i artikeldatabasen Arto)

Melindasamkatalog

Fennica

Ex Libris Aleph ILS

Nationalsamlingen

Fennica är samtidigt en katalog över nationalsamlingen, som är en arkivsamling över den nationella publikationsproduktionen.

Nationalsamlingen innehåller tryckt material från början av 1800-talet fram till dags dato.

I Nationalsamlingen ingår dessutom utländskt material som är finskspråkigt, publicerat av finländare eller som handlar om Finland (s.k. utlandsfennica).

NATIONAL BIBLIOGRAPHY

with apologies to Scott Adams

Fennica

Finna.fi

Sökmotor för material i Finlands museum, arkiv och bibliotek+ reservation, lånefunktioner ...

Fennica-LDdata.nationallibrary.fi

Fennica publicerat som länkad data

Varför skapa Fennica-LD?

1. Göra bibligrafisk data mer synligt, också internationellt

2. Förbättra kvaliteten och interoperabiliteten

3. Lära oss om nya metoder och teknologier

4. Varför inte? :)

Fennica-LD vs. Libris XLFennica-LD Libris XL

Syfte Konvertering av finska nationalbibliografin till länkad data samt publicering av sultresultatet i hanterbar form

Samkatalog för hantering av bibliografisk metadata

Originalformat för metadata MARC21 BIBFRAME / JSON-LD

Datamodell Schema.org-baserad BIBFRAME-baserad

Exportformat Olika RDF-format (RDF/XML, Turtle, N-Triples, JSON-LD, HDT)

JSON-LD, MARC

Användargränssnitt data.nationallibrary.fi Endast internt bruk

Driftstatus Experimentell drift sedan 12/2017 I produktion sedan 7/2018

bib record

bib record

bib record

bib record

auth record

auth record

auth record

bib record

bib record

auth record

auth record

auth record

1M bib records 125k person names

40k corporate names

35k subjects (YSA)bib record

bib record

bib record

bib record

bib record

bib record

auth record

auth record

auth record

bib record

bib record

auth record

auth record

auth record

Work

Instance

Person

Subject1M bib records 125k person names

40k corporate names

35k subjects (YSA)bib record

bib record

Place

Organization

Work

Instance

Person Subject

Image credit: MaryMaking blog

bib record

bib record

bib record

bib record

auth record

auth record

auth record

bib record

bib record

auth record

auth record

auth record

125k person names

40k corporate names

35k subjects (YSA)bib record

bib record

1M bib records

As seen in:

SWIB16 talk

DCMI webinar

o-bib journal article

“From MARC silos to Linked Data silos”

med Verk och Instanser såsom i BIBFRAME

för att beskriva våra entiteter från ett webbfokuserat slutanvändarperspektiv

Special thanks to Richard Wallisfor help with applying schema.org!

Item

Manifestation

Expression

WorkKultur i vidare mening

Bibliotekens dagliga verksamhet

FRBR / RDA

MARC LinkedData?

MARCXML

BIBFRAME RDF

Schema.org RDF

Linked to external URIs

MARC / Aleph seq

With deduplicated works

Work keys

With deduplicated agents

Agent keys

Convert &clean usingCatmandu

Convert usingmarc2bibframe2

Convert to Schema.org using SPARQL CONSTRUCT

YSA subjects

YSO subjects

Corporate names

RDA Media, Content, Carrier

Link against controlled vocabularies using SPARQL

Generate work keysfor merging using SPARQL

Merge worksusing SPARQL

Merge agents(person, org)using SPARQL

RDFstore

https://github.com/NatLibFi/bib-rdf-pipeline

Data dump downloads

Publicering som länkade data (och MARC)både för människor och för maskinerunder CC0-licens

RDFHDT

Jena Fuseki

bib-lod-uiFlask app

HTML+JSON-LD

OpenSearch API

Linked Data RDFRDFstore

RDFN-Triples

MARCrecords Linked Data

Fragmentsserver

SPARQL

LDF

Demohttp://data.nationallibrary.fi/bib/me/W00002848700

Datamodell med dokumentation

Utmaningar

Identitetshantering

Bibliotek har traditionellt hanterat identiteter (t.ex. personer, verk, orter, ämnen) med auktoriserade namnformer - strängar

Strängar är problematiska. Det skulle vara bättre att ha stabila identifikatorer i stället. Det gör man oftast inte i MARC.

Vi har ganska många dubbletter (mest personer och verk) i Fennica-LD:● vet inte alltid om två personer med samma namn är på riktigt samma person● ett svårt problem att identifiera verk från traditionella bibliografiska poster

Detta torde vara lättare i Libris XL, eftersom ni jobbar med länkade entiteter.

“Cool URIs don’t change” -- Tim Berners-Lee

...men vi konverterar om och om MARC-poster, som ändras hela tiden!

Work

Instance

Person

Subject

Place

Organization

LCSH

Finnish Place Name Registry

Wikidata

Work

Instance

Person

Subject

Place

Organization

LCSH

Finnish Place Name Registry

Wikidata

WorldCat

Other nationallibraries

WorldCat Works

LIBRIS XL?

ISNI

VIAF ISNI

Wikidata

Nya möjligheter

SPARQL-gränssnitt http://data.nationallibrary.fi/bib/sparql

Personer som behandlas i >100 verk

FennicaTrends visualiseringsverktyg utvecklat i WIDE hackathon

Framtida steg1. Berikning och städning av RDF-data, t.ex. mer specifika klasser såsom Map

2. Vidareutveckling av verksbeskrivningar och extraktion av verk

3. Djupare sammankoppling till andra länkade dataset

4. Utvidgning till andra kataloger: diskografin Viola, artikeldatabasen Arto

Tack så [email protected] - @OsmaSuominen

http://data.nationallibrary.fi - @NatLibFiData

Öppen källkod:https://github.com/NatLibFi/bib-rdf-pipeline

https://github.com/NatLibFi/bib-lod-ui

Denna presentation: http://tinyurl.com/fennica-ld-kb