clever search: a wordnet based wrapper for internet search engines peter m. kruse, andré naujoks,...
TRANSCRIPT
Clever Search: A WordNet Based Wrapper forInternet Search Engines
Peter M. Kruse, André Naujoks, Manuela Kunze, Dietmar Rösner
Otto-von-Guericke-Universität Magdeburg
Manuela Kunze
2
GermaNet-Workshop 2005
Überblick
Einleitung
Clever Search
Pre-Filter
Post-Filter
Zusammenfassung
Manuela Kunze
3
GermaNet-Workshop 2005
Einleitung
Probleme herkömmlicher Suchmaschinen im Web
Ergebnisse beinhalten nicht relevante Seiten fehlende Gruppierung der Ergebnisse
Manuela Kunze
4
GermaNet-Workshop 2005
Intelligente Suchmaschinen
Vivísimo (http://vivisimo.com )
Clusty (http://clusty.com)
basierend auf textuelle und semantische Ähnlichkeit (Heuristiken)
Manuela Kunze
5
GermaNet-Workshop 2005
Vivísimo/Clusty
Manuela Kunze
6
GermaNet-Workshop 2005
Vivísimo/Clusty
Manuela Kunze
7
GermaNet-Workshop 2005
Vivísimo/Clusty
Problem:viele Clusterzu detailliert
Lösung: Bestimmung von relevanten Termen
Anfrage spezifizierenGruppierung von Ergebnissen
Manuela Kunze
8
GermaNet-Workshop 2005
Clever Search
Integration von WordNet
2 Modi verfügbarErweiterung der Anfrage: pre-filterGruppieren der Ergebnisse: post-filter
Manuela Kunze
9
GermaNet-Workshop 2005
Clever Search
Spezifizierung der Anfrage WordNet
Bestimmung der Cluster
Such-maschine
ErgebnislisteClustern der Ergebnisse
Ergebniscluster
pre-filter post-filter
Manuela Kunze
10
GermaNet-Workshop 2005
Clever Search: Pre-Filter
Suchanfrage wird spezifiziert
Nutzung konzeptueller InformationenHypernyms (Hyponyms)
Erweiterung der Anfrage um die Konzepte der selektierten Lesart
Manuela Kunze
11
GermaNet-Workshop 2005
Clever Search: Pre-FilterBeispiel: ham
Manuela Kunze
12
GermaNet-Workshop 2005
Clever Search: Pre-Filter
Manuela Kunze
13
GermaNet-Workshop 2005
Clever Search: Post-Filter
Einordnung der Ergebnisseiten in Cluster
Festlegung der Cluster anhand der Informationen aus WordNet
Berechnung der Cluster-Zugehörigkeit der Ergebnisseiten anhand
Vorkommen der Konzepte aus den SynsetsHypernyms, Hyponyms, Meronyms, Holonyms
Manuela Kunze
14
GermaNet-Workshop 2005
Wichtung der Ergebnisseiten
SuchbegriffListe aller Konzepte
aus WordNet
WordNetKonzepte aus den Synsets der Relationen: Hypernym, Hyponym, Meronym, Holonym
Wichtung der Konzepte
für jedes Cluster/Lesart in WordNet
Such-maschine
Ergebnisseiten
Anzahl der Vorkommen der Konzepte
Clusterwert
Manuela Kunze
15
GermaNet-Workshop 2005
Clever Search: Post-Filter
Manuela Kunze
16
GermaNet-Workshop 2005
Verbesserung der Bewertung
Anzahl der Vorkommen eines Konzeptes in verschiedenen Lesartennutzerbasierende Wichtung der konzeptuellen Relationen (z.B. Hypernym > Meronym)Berücksichtigung der Länge bzw. Anzahl der Token einer WebseiteBerücksichtigung der anderen ClusterwerteWorthäufigkeiten (TF, IDF)
Manuela Kunze
17
GermaNet-Workshop 2005
Integration von GermaNet möglich?
ja - durch Anpassungen Beschreibungen der Lesarten fehlen
Ersatz:Anzeige der Hypernym-, Hyponym-Konzepte
Manuela Kunze
18
GermaNet-Workshop 2005
Zusammenfassung
Aufsatz für herkömmlicher Suchmaschinen2 Modi basierend auf den WordNet-Informationen
pre-filter:Spezifizierung der Suchanfrage
post-filter:einfache Gruppierung der Ergebnisseiten
verfügbar unterhttp://oslo.cs.uni-magdeburg.de/~cegeie/