architektur eines nlg- systems · 13/32 architektur eines nlg-systems the month was cooler and...

32
1/32 Architektur eines NLG-Systems Architektur eines NLG- Systems Tim Höcker

Upload: others

Post on 31-Aug-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

1/32Architektur eines NLG-Systems

ArchitektureinesNLG-

Systems

Tim Höcker

Page 2: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

2/32Architektur eines NLG-Systems

1. Dokumentplanung (document planner)

2. Mikroplanung (microplanner)

3. Oberflächenrealisation (surface realiser)

3 Phasen

Page 3: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

3/32Architektur eines NLG-Systems

Aufbau des Generierungssystems

four- tuple (k,c,u,d)

Document Plan

Text Specifications

Microplanner

Document Planner

Surface Realiser

Page 4: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

4/32Architektur eines NLG-Systems

Four-Tuple (k,c,u,d)

● k = Knowledge Source

● c = Communicative Goal

● u = User Model

● d = Discourse History

Page 5: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

5/32Architektur eines NLG-Systems

Wissensquelle (Knowledge Source)

● enthält Wissen über die Domäne, encodiert in Daten- und Wissensbasen

● anwendungsabhängig

● daher keine charakteristische Standarderscheinung

Page 6: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

6/32Architektur eines NLG-Systems

Communicative Goal● nicht zu verwechseln mit der

overall purpose

● definiert die kommunikative Zielsetzung eines Textes

● verschiedene kommunikative Ziele (x,y,z,)

● wenn x mit einem Wert aus der Datenbank gefüllt wird, dann spricht man von einer Instanz eines kommunikativen Ziels

Page 7: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

7/32Architektur eines NLG-Systems

User Model● charakterisiert den Benutzer

● Domänwissen

● Technisches Vokabular

● stilistische und linguistische Vorlieben z.B. it´s vs. it is

● legt aufgrund dieser Charakterisierung fest, welche Informationen betont oder weggelassen werden sollten

Page 8: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

8/32Architektur eines NLG-Systems

Discourse History

● verantwortlich für die korrekte Benutzung anaphorischer Stilmittel z.B. Pronomen

● kann Vergleiche zu vorherigen Aktionen zeigen

● kann null sein

Page 9: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

9/32Architektur eines NLG-Systems

Document Planner

● Content Determination

● Document Structuring

Page 10: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

10/32Architektur eines NLG-Systems

Content Determination

● welche Informationen sprachlich im fertigen Text generiert werden sollten

● Faktoren, welche die Inhaltsfestlegung beeinflussen:● Charakteristika des Benutzers (Dau)● unterschiedliche communicative goals● Constraints !?!● erwähnenswerte Besonderheiten in der

Informationsquelle● anwendungsabhängig, daher keine Festlegung von

generellen Regeln möglich● GRICEsche Maxime

Page 11: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

11/32Architektur eines NLG-Systems

Document Structuring

● den zu übermittelnden Daten wird eine Struktur auferlegt

● Rezipienten haben genreabhängige Erwartungen an einen Text

● beinhaltet mehr als nur das Ordnen der Informationen an der Oberfläche

● Tiefenstruktur

Page 12: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

12/32Architektur eines NLG-Systems

Tiefenstruktur

1.alle Informationen werden ihrem Inhalt entsprechend geordnet, z.B. Temperaturinfos in einen Satz, alle Niederschlagsinfos in den nächsten Satz, usw.

2.Informationen werden unter Berücksichtigung der Verlaufsrelation gruppiert, z.B. allgemeine Aussagen über das Wetter in einen Abschnitt, detailiertere Aussagen in den nächsten Abschnitt

Page 13: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

13/32Architektur eines NLG-Systems

The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year so far is well below average. There was rain on every day for eight days from the 11th to the 18th,with mist and fog patches on the 16th and 17th . Rainfall amounts weremostly small, with light winds.

general information significant events

temperature rainfall rainydays total rain

rainspell mist rainquantity windquantity + fog

Tiefenstruktur

Page 14: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

14/32Architektur eines NLG-Systems

Document Plan

● Output of the Document Planner

● keine komplette Spezifizierung

● viele verschiedene Texte wären kompatibel mit den Informationen des Document Planner, die Feinabstimmung erfolgt in der Phase des Microplanning

Page 15: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

15/32Architektur eines NLG-Systems

Strukturinformationen

Inhaltsangaben Messages

Document Plan

Discourse Relations

Inhaltsangaben Messages

Page 16: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

16/32Architektur eines NLG-Systems

Messages

● im einfachsten Fall korrespondiert eine Message mit einem Satz

● abstrakte Informationen, die zwischen den Datenstrukturen des Anwendungsprogramms und dem zu generierenden Text vermitteln

● Hierfür muss eine domänspezifische Konzeptrepräsentation erstellt werden, d.h. Es müssen Entitäten, Konzepte und Relationen für bestimmte Domänen definiert werden. Wie das geht erfahren wir in der nächsten Stunde

Page 17: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

17/32Architektur eines NLG-Systems

Microplanning

● Lexicalisation

● Referring Expression Generation

● Aggregation

Page 18: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

18/32Architektur eines NLG-Systems

Lexicalisation

● wählt die adäquaten Wörter, um den zuvor ausgewählten Inhalt wiederzugeben

● entscheidet zwischen verschiedenen linguistischen Realisierungsmöglichkeiten

z.B. the car owned by Mary vs. Mary´s car● Problem: Multilinguale Programme. Man könnte

unabhängige Lexikalisierungssysteme für die Zielsprachen konstruieren, aber wasteful. Ideale sprachunabhängige Regeln z.B. ' vermeide unnötige lange Auflistung' , sollten über verschiedene Sprachen verteilt gelten, aber wie das funktionieren soll steht in den Sternen.

Page 19: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

19/32Architektur eines NLG-Systems

Referring Expression Generation

● verantwortlich für die eindeutige Identifizierung von Entitäten

● Erster Bezug: Initial Reference● Zweiter Bezug: Subsequent Reference (oft

Pronomen)● Ambiguität muss vermieden werden● Beispiele: - 1. März 2003

- März - März vorigen Jahres - letzten Monat - Es

Page 20: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

20/32Architektur eines NLG-Systems

Aggregation

● entscheidet über die linguistische Struktur, mit der die zuvor bestimmten Infos generiert werden (Absätze, Sätze, Nominalphrasen)

● Sätze werden hinsichtlich ihrer Reihenfolge geordnet

● Interaktion mit Lexicalisation

● Eine Verbesserung des Flusses und der Lesbarkeit eines Textes sollte ausschlaggebend für die verwendete Ausdrucksweise sein.

Page 21: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

21/32Architektur eines NLG-Systems

Beispiel Satzaggregation

Der Monat war kühler als der Durchschnitt. Der Monat war trockener als der Durchschnitt.

Der Monat war kühler und trockener als der Durchschnitt.Der Monat war kühler als der Durchschnitt, mit weniger Niederschalg als gewöhnlich.

Page 22: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

22/32Architektur eines NLG-Systems

Microplanning

● Document Planner: Die Info, dass ein Zug um 7:40 ankommt und um 7:45 Richtung Köln abfährt, ist relevant und soll generiert werden.

● Microplanner: Wie soll das ausgedrückt werden. ● Es wäre möglich die Phase des Microplanning zu

überspringen und alle Entscheidungen bereits in der Phase des Documentplannings zu treffen. Die Messages enthielten dann konkrete Informationen, die jeweils in einem einzelnen Satz ausgedrückt würden und somit könnte z.B.auf Aggregation verzichtet werden. Dies würde allerdings eine Einschränkung der Flexibilität bedeuten.

Page 23: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

23/32Architektur eines NLG-Systems

Text Specifications

● Output of the Microplanner● enthält alle Daten, die für die Generierung notwendig

sind● interne Knoten spezifizieren die Struktur (Absätze,

Überschriften, usw...)● Blätter sind Phrase Specifications● Mehrere Messages können zu einer Phrase

Specification zusammengefasst werden

Page 24: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

24/32Architektur eines NLG-Systems

Strukturinformationen

Phrase Specifications

Text Specifications

Strukturinformationen

Ph Spec Ph Spec Ph Spec

Page 25: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

25/32Architektur eines NLG-Systems

Phrase Specifications

● spezifiziert einen Satz oder eine Satzeinheit z.B. NP bei Überschrift● kann in verschiedenen Graden der Abstraktion

auftreten● Orthographic String● Canned Text● Abstract Syntactic Structure● Lexicalised Case Frames● je abstrakter, desto komplexer,desto flexibler

Page 26: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

26/32Architektur eines NLG-Systems

Orthographic String

type: PSOrthographicString body: The month had some rainy days.

Page 27: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

27/32Architektur eines NLG-Systems

Canned Text

type: PSCannedText

text : the month had some rainy days

Page 28: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

28/32Architektur eines NLG-Systems

Abstract Syntactic Structuretype: PSAbstractSyntaxhead: havefeatures: tense: past

type: PSAbstractSyntaxsubject: head: month

features: definite: truetype: PSAbstractSyntaxhead: day

number: pluralobject: features:

definite: false type: PSAbstract Syntax

modifiers: head: rainy

Page 29: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

29/32Architektur eines NLG-Systems

Lexicalised Case Frames

● Konstituenten werden durch semantische Rollen spezifiziert

z.B. possersor oder possessed● sem. Kategorisierung hat gegenüber der syn.

Kategorisierung den Vorteil, dass der Benutzer mehr Spielraum hat

Page 30: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

30/32Architektur eines NLG-Systems

Surface Realisation

● strukturelle Realisation

● linguistische Realisation

Page 31: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

31/32Architektur eines NLG-Systems

Strukturelle Realisation

● die meisten NLG-Systeme benutzen ein externes Präsentationssystem (Netscape,Word)

● für die internen Knoten (Struktur),müssen entsprechende mark-up-Symbole generiert werden

z.B. <p> oder \par

Page 32: Architektur eines NLG- Systems · 13/32 Architektur eines NLG-Systems The month was cooler and drier than average, with the average mumber of rain days. The total rain for the year

32/32Architektur eines NLG-Systems

● Input sind die Text Specifications● müssen in einen Text konvertiert werden● verantwortlich für die grammatische Wohlgeformtheit z.B. korrekte Wahl der Verbflexion● etablierteste Bereich der NLG

– REALPRO: Abstract Syntactic Representations– SURGE, KPML: Lexicalised Case Frames

Linguistische Realisation