serengeti – webbasierte semi-automatische annotation ... · serengeti – webbasierte...
TRANSCRIPT
![Page 1: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/1.jpg)
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Text TechnologicalModelling of Information
Serengeti – webbasierte semi-automatische
Annotation semantischer Relationen
Nils Diewald, Anna Garbar, Daniela Goecke, Maik Stührenberg
![Page 2: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/2.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 3: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/3.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 4: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/4.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
• Sekundäre Informationsstrukturierung und Verknüpfung heterogener texttechnologischer Ressourcen
• Teilprojekt der DFG Forscherguppe 437 „Texttechnologische Informationsmodellierung“
• Projektziele:1. Entwicklung einer Architektur zur Integration heterogener
Texttechnologischer Resourcen2. Definition eines abstrakten Datenformats für Multi-Ebenen-Annotation3. Anwendungsdomäne: Anaphernresolution, speziell die Auflösung von
Bridging-Relationen definiter Beschreibungen
![Page 5: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/5.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Anwendungsdomäne:• Anaphorische Relation bestehen zwischen einem phorischen Element
und einem oder mehreren Antezedenzien• Anaphorische Relationen werden zwischen Diskursentitäten annotiert• Für die Auflösung anaphorischer Relationen, speziell Bridging-
Relationen, wird eine Vielzahl von Informationen benötigt • Linguistische Ressourcen werden mittels Markup-Unifikation
miteinander verknüpft• Jede Diskursentität ist durch ein XML Element und dessen Attribute
beschrieben und eindeutig identifizierbar• XML Element- und Attributinformationen werden als Merkmalsverktoren
reinterpretiert
![Page 6: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/6.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Anforderungen:• Die Integration der Ressourcen sowie die Anwendungsressource soll
formal evaluierbar sein (Precision/Recall)• Realisierung der Anaphernauflösung mittels Entscheidungsbäumen
(C4.5)Die Eignung von Enscheidungsbäumen für die Auflösung anaphorischer Relationen wurde bereits von Xiaofeng et al. (2004); Strube & Müller (2003) gezeigt
• hier: Fokus auf Integration und Evaluation verschiedener Ressourcen, d.h. verschiedener Merkmalssets
![Page 7: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/7.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Herangehensweise:• Erstellen eines Korpus anaphorischer Relationen für
• Korpustudien• Training und Evaluation
Die Korpuserstellung umfasst:• die Definition eines Annotationsschemas• Zusammenstellung des Korpus (C1 Korpus + Zeitungsartikel)• die Annotation der Daten
![Page 8: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/8.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Gewünscht:• Die Unterstützung der Annotationsarbeit durch ein
Annotationswerkzeug, das die folgende Arbeitschritte ermöglicht:• Annotation der Daten• Analyse der Annotationen auf Vollständigkeit und Inter-Annotator-
Vergleich
![Page 9: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/9.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Die Anwendungsdomäne im Überblick
Training und Evaluation der unterschiedlichen Merkmalssets
Rohdaten
XMLKorpus-daten
Ressource 1
Ressource 2
Anwendung der Ressourcen und Markup-Unifikation
Annotationanaphorischer
Relationen
XMLKorpus-daten
Definitionunterschiedlicher
Merkmalssets
![Page 10: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/10.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Projekt Sekimo
Die Anwendungsdomäne im Überblick
Training und Evaluation der unterschiedlichen Merkmalssets
Rohdaten
XMLKorpus-daten
Ressource 1
Ressource 2
Anwendung der Ressourcen und Markup-Unifikation
Annotationanaphorischer
Relationen
XMLKorpus-daten
Definitionunterschiedlicher
Merkmalssets
![Page 11: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/11.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 12: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/12.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
Das verwendete Annotationsschema...• ...ist entwicklungshistorisch gesehen eine Erweiterung des von Holler
(2004) vorgestellten Schemas• ...modelliert anaphorische Relationen als XML Standoff-Annotation
![Page 13: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/13.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
Dem Annotationsschema zugrunde liegt eine Taxonomie hinsichtlich...• ...des NP-Typs
• Pronominalanaphern• NP-Anaphern (Definite Beschreibungen)
• ...des Typs der anaphorischen Relation• Kospezifikation• Bridging
![Page 14: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/14.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
• cospecLink• ident• propName• synonym• hyperonym• hyponym• paraphrase• addInfo• isA
• bridgingLink• poss• setMember• hasMember• meronym• holonym• bridging
![Page 15: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/15.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
• cospecLink• ident• propName• synonym• hyperonym• hyponym• paraphrase• addInfo• isA
• bridgingLink• poss• setMember• hasMember• meronym• holonym• bridging
• Relationen bestehen zwischen Diskursentitäten
• Diskursentitäten als Markables• cospecLink: Referenzidentität
zwischen dem anaphorischen Element und dem Antezedens/den Antezedentien
• bridgingLink: keine Referenzidentität, das Antezedens muss aus dem Kontext inferiert werden
![Page 16: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/16.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
• cospecLink• ident• propName• synonym• hyperonym• hyponym• paraphrase• addInfo• isA
• bridgingLink• poss• setMember• hasMember• meronym• holonym• bridging
• Relationen bestehen zwischen Diskursentitäten
• Diskursentitäten als Markables• cospecLink: Referenzidentität
zwischen dem anaphorischen Element und dem Antezedens/den Antezedentien
• bridgingLink: keine Referenzidentität, das Antezedens muss aus dem Kontext inferiert werden
ein Mann – er
die Großmutter – die Oma
Lehrwerke – die DAF-Lehrwerke
Jacqueline Schulte – die 20jährige
die Kinder – ihre Lebenschancen
Maik Marie – die Kinder
Kindergeburtstage – Geschenke
![Page 17: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/17.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationsschema
Annotiert werden• Diskursentitäten
• nominal• namedEntity• propositional (in Kooperation mit C1)
• Vollständige Annotation für Pronomen und definite Beschreibungen
![Page 18: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/18.jpg)
Text TechnologicalModelling of Information
Annotationsschema – Beispielannotation
Maik hat kein eigenes Fahrrad und Marie fährt nicht in den Urlaub. Zwei Kinder, eine Gemeinsamkeit.<de deID="de8" deType="namedEntity" headRef="w36"> <token ref="w36">Maik</token></de><token ref="w37">hat</token> <token ref="w38">kein</token> <token ref="w39">eigenes</token> <token ref="w40">Fahrrad</token>, <token ref="w42">und</token><de deID="de10" deType="namedEntity" headRef="w43"> <token ref="w43">Marie</token></de><token ref="w45">fährt</token> <token ref="w46">nicht</token> <token ref="w47">in</token> <de deID="de11" deType="nom" headRef="w49"> <token ref="w48">den</token> <token ref="w49">Urlaub</token></de> <de deID="de12" deType="nom" headRef="w53"> <token ref="w52">Zwei</token> <token ref="w53">Kinder</token></de>,<de deID="de13" deType="nom" headRef="w56"> <token ref="w55">eine</token> <token ref="w56">Gemeinsamkeit</token></de>.<token_ref id="w36" dependHead="w37" pos="N" syntax="@NH" dependValue="subj" morpho="MSC SG NOM" text=“Maik“ lemma=“maik“ /><semRel> <bridgingLink relType="hasMember" antecedentIDRefs="de8 de10" phorIDRef="de12"/></semRel>
![Page 19: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/19.jpg)
Text TechnologicalModelling of Information
Annotationsschema – Beispielannotation
Maik hat kein eigenes Fahrrad und Marie fährt nicht in den Urlaub. Zwei Kinder, eine Gemeinsamkeit.<de deID="de8" deType="namedEntity" headRef="w36"> <token ref="w36">Maik</token></de><token ref="w37">hat</token> <token ref="w38">kein</token> <token ref="w39">eigenes</token> <token ref="w40">Fahrrad</token>, <token ref="w42">und</token><de deID="de10" deType="namedEntity" headRef="w43"> <token ref="w43">Marie</token></de><token ref="w45">fährt</token> <token ref="w46">nicht</token> <token ref="w47">in</token> <de deID="de11" deType="nom" headRef="w49"> <token ref="w48">den</token> <token ref="w49">Urlaub</token></de> <de deID="de12" deType="nom" headRef="w53"> <token ref="w52">Zwei</token> <token ref="w53">Kinder</token></de>,<de deID="de13" deType="nom" headRef="w56"> <token ref="w55">eine</token> <token ref="w56">Gemeinsamkeit</token></de>.<token_ref id="w36" dependHead="w37" pos="N" syntax="@NH" dependValue="subj" morpho="MSC SG NOM" text="Maik" lemma="maik" /><semRel> <bridgingLink relType="hasMember" antecedentIDRefs="de8 de10" phorIDRef="de12"/></semRel>
![Page 20: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/20.jpg)
Text TechnologicalModelling of Information
Annotationsschema – Beispielannotation
Maik hat kein eigenes Fahrrad und Marie fährt nicht in den Urlaub. Zwei Kinder, eine Gemeinsamkeit.<de deID="de8" deType="namedEntity" headRef="w36"> <token ref="w36">Maik</token></de><token ref="w37">hat</token> <token ref="w38">kein</token> <token ref="w39">eigenes</token> <token ref="w40">Fahrrad</token>, <token ref="w42">und</token><de deID="de10" deType="namedEntity" headRef="w43"> <token ref="w43">Marie</token></de><token ref="w45">fährt</token> <token ref="w46">nicht</token> <token ref="w47">in</token> <de deID="de11" deType="nom" headRef="w49"> <token ref="w48">den</token> <token ref="w49">Urlaub</token></de> <de deID="de12" deType="nom" headRef="w53"> <token ref="w52">Zwei</token> <token ref="w53">Kinder</token></de>,<de deID="de13" deType="nom" headRef="w56"> <token ref="w55">eine</token> <token ref="w56">Gemeinsamkeit</token></de>.<token_ref id="w36" dependHead="w37" pos="N" syntax="@NH" dependValue="subj" morpho="MSC SG NOM" text="Maik" lemma="maik" /><semRel> <bridgingLink relType="hasMember" antecedentIDRefs="de8 de10" phorIDRef="de12"/></semRel>
![Page 21: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/21.jpg)
Text TechnologicalModelling of Information
Annotationsschema – Beispielannotation
Maik hat kein eigenes Fahrrad und Marie fährt nicht in den Urlaub. Zwei Kinder, eine Gemeinsamkeit.<de deID="de8" deType="namedEntity" headRef="w36"> <token ref="w36">Maik</token></de><token ref="w37">hat</token> <token ref="w38">kein</token> <token ref="w39">eigenes</token> <token ref="w40">Fahrrad</token>, <token ref="w42">und</token><de deID="de10" deType="namedEntity" headRef="w43"> <token ref="w43">Marie</token></de><token ref="w45">fährt</token> <token ref="w46">nicht</token> <token ref="w47">in</token> <de deID="de11" deType="nom" headRef="w49"> <token ref="w48">den</token> <token ref="w49">Urlaub</token></de> <de deID="de12" deType="nom" headRef="w53"> <token ref="w52">Zwei</token> <token ref="w53">Kinder</token></de>,<de deID="de13" deType="nom" headRef="w56"> <token ref="w55">eine</token> <token ref="w56">Gemeinsamkeit</token></de>.<token_ref id="w36" dependHead="w37" pos="N" syntax="@NH" dependValue="subj" morpho="MSC SG NOM" text="Maik" lemma="maik" /><semRel> <bridgingLink relType="hasMember" antecedentIDRefs="de8 de10" phorIDRef="de12"/></semRel>
![Page 22: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/22.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 23: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/23.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationswerkzeuge
Es gibt bereits eine Reihe von Werkzeugen zur Annotation unimodaler und multimodaler Dokumente:
![Page 24: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/24.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationswerkzeuge
Es gibt bereits eine Reihe von Werkzeugen zur Annotation unimodaler und multimodaler Dokumente:
Warum ein weiteres Annotationswerkzeug?
![Page 25: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/25.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Annotationswerkzeuge
Nachteil einer Reihe von existierenden Werkzeugen:• lokale Datenhaltung
Anforderung an ein neues Annotationswerkzeug:• zentrale Datenhaltung• Unterstützung einer verteilten Korpuserstellung
![Page 26: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/26.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 27: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/27.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Serengeti – Semantic Relations Annotation Tool
• Webbasierte Client-Server-Applikation (aktuelle Version 0.7 implementiert für Mozilla Firefox > 1.0)
• Ajax-Architektur (Perl, JavaScript, XHTML, CSS)• Vorteile:
• Zentrale Verwaltung eines Korpus• parallele Annotation eines Dokuments durch mehrere Benutzer• Operationen über mehrere Annotationen (Vergleich und Merge)• keine Installation notwendig
![Page 28: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/28.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Serengeti – Semantic Relations Annotation Tool
![Page 29: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/29.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
• Auswahl der Gruppe• Auswahl des Dokuments• Funktionen für
• Speicherung• Export• Commit• Print• Logout
Serengeti – Semantic Relations Annotation Tool
![Page 30: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/30.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
• Anzeige des Dokuments• Layout• Auswahl der Diskursentitäten
Serengeti – Semantic Relations Annotation Tool
![Page 31: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/31.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
• Spezifizierung des Relationstyps• Editieren und Löschen• Status-Anzeige
Serengeti – Semantic Relations Annotation Tool
![Page 32: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/32.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
• Anzeige und Auswahl erstellter Relationen• Farbliche Hervorhebungen
Serengeti – Semantic Relations Annotation Tool
![Page 33: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/33.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Serengeti – Semantic Relations Annotation Tool
• Auswahl des Dokuments• Anzeige der Annotatoren und ihrer Bearbeitungsstatus
![Page 34: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/34.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Serengeti – Semantic Relations Annotation Tool
• Auswahl der Annotationen• Anzeige der Annotatoren und ihrer Bearbeitungsstatus
![Page 35: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/35.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Serengeti – Semantic Relations Annotation Tool
• Anzeige der Relationen beider Annotationen• Konfliktrelationen werden gegenübergestellt• Konfliktart wird dargestellt
![Page 36: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/36.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Übersicht
• Projekt Sekimo• Annotationsschema zur Annotation semantischer Relationen• Annotationswerkzeuge• Serengeti• Zusammenfassung und Ausblick
![Page 37: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/37.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Zusammenfassung
• Serengeti bietet die Möglichkeit große Datenmengen in hoher Qualität zu annotieren
• zentrale Verwaltung eines Korpus• parallele Annotation eines Dokuments durch mehrere Benutzer• Operationen über mehrere Annotationen• keine Installation notwendig• modular konzipiertes System
![Page 38: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/38.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Ausblick
• Generalisierung des Annotationswerkzeuges für die Annotation weiterer Diskursrelationen, z.B. lexikalischer Ketten
• Externe Definition von Markables und Relationen, aktuelle Anwendungsfälle:• Markable=DE; Relation=cospecLink/bridgingLink• Markable=Lemma; Relation=lexicalChain
• Anwendung in der DFG-Forschergruppe:• Korpusstudien• Annotationsschichten als Ressource für die Diskursanalyse
• Erweiterung um Berechnung der Inter-Annotator-Reliabilität (z. B. kappa, AC
1)
• Abfragetool zur Suche in Annotationen
![Page 39: Serengeti – webbasierte semi-automatische Annotation ... · Serengeti – webbasierte semi-automatische Annotation semantischer Relationen Nils Diewald, Anna Garbar, Daniela Goecke,](https://reader033.vdocument.in/reader033/viewer/2022050600/5fa7f5408f4aa76f213070e3/html5/thumbnails/39.jpg)
Text TechnologicalModelling of Information
Workshop on Ontologies and Semantic Lexica in Automated Discourse Analysis – GLDV 2007
Vielen Dank für Ihre Aufmerksamkeit!