building and managing knowledge graphs · building and managing knowledge graphs —wolf-tilo balke...
TRANSCRIPT
Institut für InformationssystemeTechnische Universität Braunschweig
Building and Managing Knowledge Graphs
Jan-Christoph Kalo and Wolf-Tilo Balke
What is a Knowledge Graph?
2Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
• Knowledge graphs are structured informationrepositories– They contain entity-centric knowledge
• Knowledge graphs support severalapplications– Web search, question answering, machine
reading, recommendation
Representing Knowledge as a Graph
3
Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig Niedersachsen
Hannover
1946
Ulrich Markuth
248.292
gegründetLand
esha
upts
tadt
Bundesland
Bürgermeister
Einwohner
(Braunschweig, Bürgermeister, Ulrich Markuth)(Braunschweig, Bundesland, Niedersachsen)(Braunschweig, Einwohnerzahl, 248.292)(Niedersachsen, Landeshauptstadt, Hannover)(Niedersachsen, gegründet, 1946)(Ulrich Markuth, typ, Politiker)
• Knowledge is represented in subject, predicate, objecttriples called facts– Nodes represent entities, classes or literals– Edges represent relationships
Politiker
typ
• This seminar is about essential techniques for:– Building knowledge graphs by extracting information from
natural language texts• Entity Linking• Relation Extraction
– Managing large knowledge graph data• Ontology Alignment• Instance Matching• Rule Mining• Knowledge Graph Embeddings• Type Inference• Measuring Knowledge Graph Completeness
Seminar Topics
4Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
• Entity Linking is– Recognizing entity mentions in text, disambiguating and
linking it to the corresponding entity in a KG
Entity Linking
5Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig ist eine Großstadt im Südosten des Landes Niedersachsen. Mit 248.292 Einwohnern (Stand 31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens.
Braunschweig Niedersachsen
Hannover
1946
Ulrich Markuth
248.292
gegründetLand
esha
upts
tadt
Bundesland
Bürgermeister
Einw
ohne
r
• Given a knowledge graph and a text, we want to extract subject, predicate, object triples– Words from text have to be mapped to concepts in the
knowledge graph
Relation Extraction
6Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig ist eine Großstadt im Südosten des Landes Niedersachsen. Mit 248.292 Einwohnern (Stand 31. Dezember 2018) ist sie nach Hannover die zweitgrößte Stadt Niedersachsens. Die kreisfreie Stadt bildet mit den Städten Salzgitter und Wolfsburg eine Regiopolregion und eines der neun Oberzentren des Bundeslandes. Sie ist Teil der im Jahr 2005 gegründeten Metropolregion Hannover-Braunschweig-Göttingen-Wolfsburg.
(Braunschweig, ist, Großstadt)(Braunschweig, Bundesland, Niedersachsen)(Braunschweig Einwohnerzahl 248.292)(Hannover, Bundesland, Niedersachsen)
• Integrate several knowledge graphs into a singleknowledge graph– Find a matching between classes and relationships of two
knowledge graphs
Ontology Alignment
7Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig Niedersachsen
Bundesland
Stadt
typ
Liegt in
typ
Braunschweig Niedersachsen
Land
Großstadt
typ
bundeslandtyp
land
Deutschland
Bundesland
• Matching instances from two heterogeneous knowledgegraphs
Instance Matching
8Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig Niedersachsen
Hannover
1946
Ulrich Markuth
248.292
gegründetLand
esha
upts
tadt
Bundesland
Bürgermeister
Einw
ohne
r Stadt Braunschweig
Niedersachsen
Hannover
1.11.1946
Markuth, Ulrich
861
gegründet
Grö
ßte
Stad
t
Bundesland
Oberbürgerm
eister
gegr
ünde
t
Präs
iden
t
Weil, Stephan
• Mine logical rules from large knowledge graphs– Rules may be used to infer new knowledge
𝐵ü𝑟𝑔𝑒𝑟𝑚𝑒𝑖𝑠𝑡𝑒𝑟(𝑥, 𝑦)⋀Land(y, z) ⇒ 𝑆𝑡𝑎𝑎𝑡𝑠𝑏ü𝑟𝑔𝑒𝑟𝑠𝑐ℎ𝑎𝑓𝑡(𝑥, 𝑧)
Rule Mining in Knowledge Graphs
9Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig Deutschland 82,79 Millionen
Ulrich Markuth
248.292
EinwohnerzahlH
aupt
stad
tLand
Bürgermeister
Einw
ohne
r
Berlin
Staatsbürgerschaft
• Embed entities and relationships from knowledge graphsinto vector spaces– Vectors can be used to measure semantic similarities and
to predict new facts
Knowledge Graph Embeddings
10Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig
Niedersachsen
TU Braunschweig
Bundesland
Lieg
t in
Braunschweig
Niedersachsen
TU Braunschweig
Bunde
sland
Liegt in
Rostock Mecklenburg-Vorpommern
Bundesland
Mecklenburg-Vorpommern
Bunde
sland
Rostock
• Automatically learn entity types from a knowledge graph
Type Inference in Knowledge Graphs
11Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Braunschweig Niedersachsen
Hannover
1946
Ulrich Markuth
248.292
gegründetLand
esha
upts
tadt
Bundesland
Bürgermeister
Einw
ohne
r Braunschweig Niedersachsen
Hannover
1946
Ulrich Markuth
248.292
gegründetLand
esha
upts
tadt
Bundesland
Bürgermeister
Einw
ohne
r
Stadttyp
Politiker
typ
Stadt
typ
Bundesland
typ
• Predict missing facts in a knowledge graph to assess itscompleteness– Having a date of death, but having no death place, implies a
missing fact
Measuring Knowledge Graph Completeness
12Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
Heinrich der Löwe Welfen
Braunschweig
6.8.1195
Adelsgeschlecht
Ges
torb
en a
m
Gestorben in
Richard Löwenherz
Haus Plantagenet6.4.1199AdelsgeschlechtGestorben am
What is a Good Talk?
13Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig 13
A Good Talk
Gestures
Examples
Eye Contact
IntroductionInteraction
Conclusion
Pace
…and more!
Course of Action
14Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
24.10.
07.11.
14.11.
21.11.
28.11.
05.12.
12.12.
19.12.
09.01.
16.01.
23.01.
30.01.
06.02.
Introduction and Assignment of topics
Analyzing talks 1
8 Talks with Extensive Feedback
Analyzing talks I1
Presentation Training I
Presentation Training I1
• Building knowledge graphs by extracting informationfrom natural language texts– Entity Linking– Relation Extraction
• Managing large knowledge graph data– Ontology Alignment– Instance Matching– Rule Mining– Knowledge Graph Embeddings– Type Inference– Measuring Knowledge Graph Completeness
Choose your topic!
15Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig
• We offer:– Guidance and Support– Active Discussion– Honest and constructive Feedback– Exciting Topics
• We require:– Intensive preparation of your own talk– Active participation– Attendance at all seminar dates– No written report
Conclusion
16Building and Managing Knowledge Graphs — Wolf-Tilo Balke — Technische Universität Braunschweig