-Zurück-

Analyzing Set Expansion as a Method for Sense Disambiguation in Compound words

Dieses Thema eignet sich auch gut dafür, zunächst als Projektarbeit begonnen zu werden und dann als Masterarbeit weitergeführt zu werden. Die Aufgabe ergibt sich aus einer Forschungskooperation mit der Anglistik und Computerlinguistik, in der es um den Zusammenhang der Semantik der Komponentenwörter mit dem zusammengesetzten Begriff geht, wofür wir aktuell Machine Learning-Modelle zur Vorhersage verwenden. Es geht in dieser Aufgabe also darum, die semantische Ähnlichkeit von zusammengesetzten Wörtern (compounds; wir untersuchen das vorrangig im Englischen) und ihren Komponenten (constituents) zu untersuchen. Hierzu ist initial ein Datensatz z.B. durch Extraktion aus WordNet und/oder anderen Quellen aufzubauen sowie die Ähnlichkeit der Wörter (z.B. durch Nutzung der weiteren Informationen in WordNet) zu bestimmen. Hierfür können verschiedene Ähnlichkeitsmaße untersucht werden. Mit Machine Learning kann der Zusammenhang zwischen den compounds und ihren constituents gelernt und zur Vorhersage genutzt werden. Hierbei ergeben sich eine Vielzahl spannender Fragestellungen, von denen dann einige nach Asprache näher untersucht werden sollen.

Ansprechpartner:

Bereich:

Heinrich Heine Universität

Datenbanken und Informationssysteme

Lehrstuhlinhaber

Prof. Dr. Stefan Conrad


Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.24
Tel.: +49 211 81-14088

Sekretariat

Lisa Lorenz



Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.22
Tel.: +49 211 81-11312
Verantwortlich für den Inhalt:  E-Mail senden Datenbanken & Informationssysteme