einführung linked open data (lod) - introduction to linked open data (lod)

Post on 07-Jul-2015

395 Views

Category:

Technology

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

Präsentation von Martin Kaltenböck (SWC) bei den Wissenschaftstagen der Akademie der Wissenschaften am 3.12. 2014 zum Thema - Einführung, Basis und Benefits von Linked Open Data (LOD) inkl. Best Practise: Linked Open Data Pilot Österreich (LOD Pilot AT - http://linkeddata.gv.at).

TRANSCRIPT

Linked Open Data (LOD)Basis, Principles, Benefits; Best Practise: LOD PILOT Austria/

Martin Kaltenböck

CFO, Semantic Web Company

www.semantic-web.at

www.poolparty.biz

@semwebcompany

Digital Humanities Tage, 3.12.2014, Wien

Introduction

Semantic Web Company (SWC)

About Semantic Web Company

Company was founded 2001 in Vienna, Austria

>20 experts in linked data technologies

Product: PoolParty Suite (launched 2009)

Serving global 500 companies

EU- & US-based consulting services

Customers we serve

Customers● Credit Suisse● Daimler● Roche● Wolters Kluwer● Tieto● Canadian Broadcasting

Corporation (CBC)● World Bank Group● The Pokémon Company● Healthdirect Australia● Ministry of Finance (A)● Wood Mackenzie● Red Bull Media House● Council of the E.U.● TC Media● American Physical Society● Education Services Australia● Pearson● Techtarget● Norwegian Directorate of

Immigration● REEEP● European Commission● Bank of America

Finance / Automotive / Publisher / Health Care / Public Administration /

Energy / Education

Partners● Cognizant● EBCONT● EPAM Systems● iQuest● PwC● DTI AG● Tenforce● OpenLink Software● Ontotext● MarkLogic● Gravity Zero● Altotech● Wolters Kluwer● Term Management● Taxonomy Strategies● Search explained● WAND● Digirati● Cognistreamer● Linked Data Factory● Taxonic● semweb

2 Main Areas of Work

PoolParty Semantic Suite

http://www.poolparty.biz

Data-, Information- and Knowledge Portals

and Data Tools, http://bit.ly/1DWtp1a

www.buildingsdata.eu

www.gbpn.org

www.eip-water.eu

www.reegle.info

Solutions…

Thesaurus Publishing Business Intelligence Content Recommendation Semantic Expert Finder

Web Mining Semantic Search Semantic Tagging in

SharePoint

Symptom Checker

… About me

Background: Communication Science, Psychology & Marketing

Work: Requirements Engineering & PM of nat. & internat. Industry & Research Projects

Co-Founder, CFO & Managing Partner SWC, www.semantic-web.at

Advisory Board Member Open Knowledge UK, www.okfn.org

Executive Board Member OKF Austria, www.okfn.at

Founding Member of Cooperation OGD Austria

Invited Expert in W3C and ISA Working Groups on Data Management Issues

Steering Group Member, European Data Forum (EDF), www.data-forum.eu

Open (Government) Data

9

Hier wird eine moderne Zusammenarbeit von Politik, Verwaltung, Zivilgesellschaft und Wirtschaft postuliert, mit den Zielen:

• Transparenz zu fördern• Partizipation und • Kollaboration zu ermöglichen

Teilbereich von Open Government = Open Government Data

Was ist Open Government?Was ist Open Government

OKFO – Open Knowledge Forum ÖsterreichOpen Government Data is a worldwide movement to open data(& information/content) of the government / public administration* - that isNOT personal (individual related) – in human- AND maschine-readableopen (non proprietary) formats for re-use (by civil society, economy, media,academia AND politics & public administration itsself)!

•….. data and information produced or commissioned by government or government controlled entities

Lucke & Geiger (Zeppelin Universität, DE)Offene Verwaltungsdaten sind jene Datenbestände des öffentlichen Sektors, die von Staat und Verwaltung im Interesse der Allgemeinheit ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.

Was ist Open Government Data?O

KFO

–h

ttp

://w

ww

.okf

n.a

t

Pro

f. D

r. J

örn

vo

n L

uck

e C

hri

stia

n P

. Ge

ige

r, M

.Ah

ttp

://w

ww

.zep

pel

in-u

niv

ersi

ty.d

e/d

euts

ch/

OKF-AT: http://www.okfn.at ; @OKFNat

Was ist Open (Government) Data?

11

1. VollständigkeitAlle öffentlichen Daten werden verfügbar gemacht. Als Öffentliche Daten werden hierbei Daten verstanden, die nicht berechtigten Datenschutz-, Sicherheits- oder Zugangsbeschränkungen unterliegen.

2. PrimärquelleDie Daten werden an ihrem Ursprung gesammelt. Dies geschieht mit dem höchstmöglichen Feinheitsgrad, nicht in aggregierten oder sonst wie modifizierten Formaten.

3. ZeitnahDaten werden so zügig, wie zur Werterhaltung, notwendig zur Verfügung gestellt.

4. Leichter ZugangDer Zugang zu Daten soll so leicht wie möglich sein (z.B.: Angebot von Formaten, APIs etc).

5. MaschinenlesbarDaten werden zur automatisierten Verarbeitung strukturiert zur Verfügung gestellt.

6. Nicht diskriminierendDaten sind für ALLE verfügbar, ohne dass z.B. eine Registrierung notwendig ist.

7. Nicht proprietärDaten werden in standardisierten Formaten bereit gestellt, über die keine juristische Person die alleinige Kontrolle hat.

8. LizenzfreiDaten unterliegen keinem Urheberrecht, Patenten, Markenzeichen oder Geschäftsgeheimnissen. Sinnvolle Datenschutz-, Sicherheits- und Zugangsbeschränkungen sind zulässig.

Die Einhaltung dieser Prinzipien ist überprüfbar.

PLUS: Sunlight Foudation, August 2010: 9) Dauerhaftigkeit / Stetigkeit & 10) Nutzungskosten

8 Prinzipien von Open Government Datah

ttp

://w

ww

.op

en

go

vd

ata

.org

/hom

e/8

princip

les

htt

p:/

/su

nlig

htf

ound

ation.c

om

/po

licy/d

ocum

ents

/ten

-ope

n-d

ata

-prin

cip

les/

8 Prinzipien von Open Government Data

12

Open Data …

Verstärkt werden Daten auch durch Nichtregierungen geöffnet undzur Wiederverwendung bereitgestellt…

ODPOpen Data Portal Österreichwww.opendataportal.atEine Kooperation vonOKF-AT, Wikimedia AT undCooperation OGD Österreich

Single Point of Access für Daten aus:• Wirtschaft• Wissenschaft• GLAM• NPO & NGO• Gesellschaft / Privatpersonen

13

Open Data in Europe

Bis zu 100 Mio Euro durch Projekte, H2020 Research et al

• EU Data Incubator• 2015 Launch Pan EU Data Portal• H2020: Open & Big Data Uptake• EC Open Data Portal• LOD as objective for publishing• EU28 National Open Data Activities• Austria: UN Public Award & EDI Award

14

Open Data in use…

Was ist wichtig, wenn man über Open Data in Use nachdenkt?

• Interoperabilität um breite & einfache Nutzung zu ermöglichen• Menschen- UND Maschinen- Lesbarkeit von Daten & Metadaten• In möglichst offenen Formaten• Für eine rasche und kosteneffiziente Datenintegration• Um auf mehreren Ebenen Effekte & Nutzen generieren zu können:

Lokal - Regional - National - EU-weit & Weltweit

Für verschiedene Nutzergruppen mit verschiedenen Interessen

• Öffentliche Verwaltung (auch für interne Nutzung!)• Politiker und Entscheidungsträger• Bürger & Zivilgesellschaft (Citizen Analysts)• Wirtschaft & Industrie (Datenintegration, -anreicherung, APPs, …)• (Daten) Journalismus, Medien & Publisher• Lehre & Wissenschaft

Putting the L in front

Von Open Data zu Linked Open Data (LOD)

16

Interoperabilität

Henry Maudslay (1771 – 1831)

He also developed the first industrially practicalscrew-cutting lathe in 1800, allowingstandardisation of screw thread sizes for the firsttime. This allowed the concept ofinterchangeability (a idea that was already takinghold) to be practically applied to nuts and bolts.Before this, all nuts and bolts had to be made asmatching pairs only. This meant that whenmachines were disassembled, careful account hadto be kept of the matching nuts and bolts ready forwhen reassembly took place.http://en.wikipedia.org/wiki/Henry_Maudslay

John Sheridan, OGD2011 Conference, Vienna, Austria: http://www.slideshare.net/semwebcompany/linking-uk-government-data-john-sheridan/

18

Do

cum

en

tso

n t

he

We

b

We

b o

f D

ocu

me

nts

AK

A H

ype

rtex

t

Dat

a o

n t

he

We

b

AK

A O

pe

n D

ata

We

b o

f D

ata

AK

A H

ype

rdat

a

The Evolution of the Internet

Tim Berners-Lee outlined four principles of linked data in his Design Issues: Linked Data

• Use URIs to denote things.• Use HTTP URIs so that these things can be referred to and

looked up (“dereferenced”) by people and user agents.• Provide useful information about the thing when its URI is de-

referenced, leveraging standards such as RDF, SPARQL.• Include links to other related things (using their URIs) when

publishing data on the Web.

Further Reading:• Wikipedia• W3C Wiki

Linked Data Design Principles

19

• Give things an URI!

• Use RDF for Publishing!

• Link your Data to other Data

(as well as the data models)!

• Provide a Standard-API on top

•Provide an API!

•Organise Data!

•License Data!

•Raw Data now!

20

Publish Data!

Use Web-Technologies

Use Linked Data!• The web is an Ecosystem

• Networked Data creates

Network Effects

• Lowers Costs of Data

Integration

Von Open Data zu Linked Open DataVon Open Data zu Linked Open Data

21

Data Integration on User Level and Application Level

Die Idee von HyperdataDie Idee von Hyperdata

22

Integration on Data Level

Application and/or API

Die Idee von HyperdataDie Idee von Hyperdata

CC-BY-SA von campuspartybrasil (flickr)

“Linked Data realizes the vision ofevolving the Web into a global datacommons, allowing applications tooperate on top of an unbounded set ofdata sources, via standardisedaccess mechanisms.

I expect that Linked Data will enable a significant evolutionary step in leadingthe Web to ist full potential.“

The Vision of the new Internet

23

Linked Open Data

in a Nutshell

1. Uses RDF Data Model

LOD WS

Vienna

03.12. 2014

SWCpresents at

starts

takesPlaceIn

2. Is serialised in triples:SWC presents at LOD WS .

LOD WS starts “20141203”^^xsd:date .

LOD WS takesPlaceAt Vienna .

3. Uses Content-negotiation

Subject Predicate Object

Linked Data in a Nutshell

25

1. Identify & analyse your data

2. Clean the data

3. Model your data (URI schema, vocabularies)

4. Select & specify license(s)

5. Convert data to RDF

6. Link your data to other data

7. Publish and promote your Linked Open Data

Quick Guide: Publish LOD

26

1. Specify concrete use cases

2. Evaluate relevant data sources & data sets

3. License clearing: check respective licenses

4. Create data consumption patterns

5. Manage alignment, caching & update mechanisms

6. Create mash-ups, GUIs, services & applications on top

7. Establish sustainable new partnerships

Quick Guide: Consume LOD

27

LOD Pilot

Österreich

Establishing a digital LOD based Data Infrastructure for Austriahttp://www.linkeddata.gv.at (coming soon)

• Wiederverwendung erleichtern durch Standard Formate

• Effiziente Datenintegration ermöglichen (z.B. durch APIs)

• Daten vernetzen um die echten Potentiale zu heben (LOD)

• Die wichtigsten Basisdaten zentral bereitstellen

• Den ‚digitalen Standort Österreich‘ attraktiv gestalten

• Internationalen Trends & Standards folgen

• Bereitstellung von vertrauenswürdigen Datenquellen welche von Verwaltung, Wirtschaft, F&E und Gesellschaft verwendet werdet können

Anforderungen an Open Data in AT

29

Relevante & wichtigste ~30-50 Basisdaten evaluieren Postleitzahlen (PLZ)Politische BezirkePoints of InterestDemographische BasisdatenSchultypenIndustriesektoren

Daten mit (trusted) URIs (Uniform Resource Identifier) versehenDatensätze nach RDF (Resource Description Framework) konvertierenDaten untereinander und extern (Dbpedia, Eurovoc, ..) verlinkenBasisdaten via HTTP frei verfügbar machen (unter: data.gv.at)

Die LOD Infrastruktur zur breiten Verwendung bewerben

Add on: LOD basierte Use Cases realisieren

Anforderungen an Open Data in AT

30

Anforderungen an Open Data in AT

31

Projekt Set Up Identifizieren & Ansprache von relevanten Stakeholdern

Aufbau von Kooperationen

Projekt Setup: Team, Umfeld, …

Spezifikation- & Data Analyse Phase Workshops mit relevanten Stakeholdern

Core Datensätze spezifizieren, URI Konzept, Lizenz, Rechtl. Fragen

Spezifikation der Infrastruktur, Architektur und Tools

Implementierungs Phase Technische Implementierung (Infrastruktur, Tools, et al)

LOD Publishing / Datenpublikation

Promotion, Events & Trainings, Support

Maintenance & Operation Phase Laufende Maintenance

Support für zukünftige Publikation und Verwendung

11-12/2013

01 - 04/2014

05- 10/2013

from 11/2014

LOD Pilot: Datenanalyse

32

In zwei Workshops, mit gesamt 20 TeilnehmerInnen, wurden mit Expertenunterschiedlicher Einrichtungen Basisdatensätze ermittelt, wobei entlang derKategorisierung von help.gv.at (sprich: Lebenslagen) vorgegangen wurde.

• 2 Stakeholder Workshops: 10.12. 2013 & 14.2.2014

• Evaluierung & Analyse data.gv.at ( & opendataportal.at)

• Empfehlung EC zu Open Data (Link)

• G8 Open Data Charter (Link) & EC Implementierung (Link)

• Konzept Basic Data Dänemark (Link)

LOD Pilot: Tools & Architektur

33

• PoolParty Server für LOD Publishing: Conversion – Creation- Linking –Publikation von Taxonomien, Code Lists et al: http://www.poolparty.biz/

• Virtuoso Triple Store für Datenspeicherung & SPARQL Endpoint: http://virtuoso.openlinksw.com/

• ETL & andere LOD Jobs: UnifiedViewshttp://www.semantic-web.at/linked-open-data-management-suite-lodms/

• SILK für Linking: http://wifo5-03.informatik.uni-mannheim.de/bizer/silk/

• Weitere RDF Converter wie Triplify oder D2R etal: http://d2rq.org/d2r-server

• Aufbau & Etablierung einer Basis LOD Infrastruktur für AT

• Angebot eines zentralen Repositories für semantische Assets in Österreich (nach ISA Ansatz, beschrieben in ADMS)

• Angebot & Etablierung von offiziellen & vertrauenswürdigen referenzierbaren Entitäten

• Angebot von Basisdaten, um Impact zu generieren (Bspl. DK)

• Umsetzung von LOD Use Cases um Potentiale aufzuzeigen

• Data Literacy vorantreiben durch LOD Trainings

• Alle relevanten Stakeholder zusammenbringen

• Die (Linked) Open Data Community einbinden (WU, TU, …)

Anforderungen an Open Data in AT

34

Contact

These slides are published under :

Copyright SWC 2014

Martin KaltenböckCFO, Semantic Web Company

+43 1 4021235

m.kaltenboeck@semantic-web.at

www.semantic-web.at

www.poolparty.biz

Gruppenarbeit

36

• Frage 1: welche Basis Datensätze sehen Sie in Ihrer

Organisation (Orte, Branchen, Organisationen, …)

• Frage 2: Welche Datensätze würden (intern /

extern) verlinkt Ihrer Ansicht nach Mehrwert

generieren?

Organisation 1

Organisation 2

Organisation 3

Dataset 1

Dataset 2

Dataset 3

Dataset 1

Dataset 2

Dataset 3

Dataset 1

Dataset 2

Dataset 3

• Less replication (offering same datasets in different places)

• Encouragement to re-use existing datasets (open standards, open formats, reduce semantic & syntactic heterogeneity)

• Clear which datasets are providing similar / same information

• More innovation and creation of new knowledge by contextualisation

• Creating network effects by linking

• Enable scale out of the growing amounts of data

The Benefits of Linked Open Data

37

What are the costs and benefits of★ web data?

As a consumer ...✔ You can look at it.✔ You can print it.✔ You can store it locally (on your hard drive or on an USB stick).✔ You can enter the data into any other system.✔ You can change the data as you wish.✔ You can share the data with anyone you like.

As a publisher ...✔ It's simple to publish.✔ You do not have explain repeatedly to others that they can use your data.

5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

From Open Data 2 Linked Open Data

38

What are the costs and benefits of★★web data?

As a consumer …you can do all what you can do with ★Web data and additionally:

✔ You can directly process it with proprietary software to aggregate it, perform calculations, visualise it, etc.

✔ You can export it into another (structured) format.

As a publisher ...✔ It's still simple to publish.

395 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

From Open Data 2 Linked Open Data

What are the costs and benefits of★★★web data?

As a consumer …you can do all what you can do with ★★Web data and additionally:

✔ You can manipulate the data in any way you like, without being confined by the capabilities of any particular software.

As a publisher ...✔ It's still rather simple to publish.! You might need converters or plug-ins to export the data from

the proprietary format.

405 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

From Open Data 2 Linked Open Data

What are the costs and benefits of★★★★web data?

As a consumer …you can do all what you can do with ★★★Web data and additionally:✔ You can link to it from any other place (on the Web or locally).✔ You can bookmark it.✔ You can reuse parts of the data.✔ You may be able to reuse existing tools and libraries, even if they only understand

parts of the pattern the publisher used.✔ You can combine the data safely with other data.

As a publisher ...✔ You have fine-granular control over the data items and can optimise their access

(load balancing, caching, etc.)✔ Other data publishers can now link into your data, promoting it to 5 star!! You typically invest some time slicing and dicing your data.! You'll need to assign URIs to data items and think about how to represent the data.! You need to either find existing patterns to reuse or create your own.

5 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/ 41

From Open Data 2 Linked Open Data

What are the costs and benefits of★★★★★web data?

As a consumer …you can do all what you can do with ★★★★Web data and additionally:

✔ You can discover more (related) data while consuming the data.✔ You can directly learn about the data schema.! You now have to deal with broken data links, just like 404 errors in web pages.! Presenting data from an arbitrary link as fact is as risky as letting people include

content from any website in your pages. Caution, trust and common sense are all still necessary.

As a publisher ...✔ You make your data discoverable.✔ You increase the value of your data.✔ You own organisation will gain the same benefits from the links as the consumers.! You'll need to invest resources to link your data to other data on the Web.! You may need to repair broken or incorrect links.

425 Stars Model on OGD, M. Hausenblas et al: http://lab.linkeddata.deri.ie/2010/star-scheme-by-example/

From Open Data 2 Linked Open Data

Example: Clean Energy Data Portal

Clean Energy Open Data Portal fully based on LOD…

http://data.reegle.info

Example: LOD Pilot Austria

Linked Open Data Pilot Austria… open data as LOD of Austrian national government, City of Vienna and OpenDataPortal Austria (ODP)

http://lodpilot.at

Example: Labour Law Thesaurus

http://vocabulary.wolterskluwer.de/arbeitsrecht/10913

• EuroVoc• Thesaurus

Sozial-Wissenschaften• DBPedia• Standard-Thesaurus

Wirtschaft

50 Billions

Facts

Example: Education Services Australia

http://scot.curriculum.edu.au/

Example: Energy Country Profiles

48

http://reegle.info/countries

top related