Universität Düsseldorf: Informatik - Lehrstuhl Datenbanken und Informationssysteme

Analyzing Set Expansion as a Method for Sense Disambiguation in Compound words

Dieses Thema eignet sich auch gut dafür, zunächst als Projektarbeit begonnen zu werden und dann als Masterarbeit weitergeführt zu werden. Die Aufgabe ergibt sich aus einer Forschungskooperation mit der Anglistik und Computerlinguistik, in der es um den Zusammenhang der Semantik der Komponentenwörter mit dem zusammengesetzten Begriff geht, wofür wir aktuell Machine Learning-Modelle zur Vorhersage verwenden. Es geht in dieser Aufgabe also darum, die semantische Ähnlichkeit von zusammengesetzten Wörtern (compounds; wir untersuchen das vorrangig im Englischen) und ihren Komponenten (constituents) zu untersuchen. Hierzu ist initial ein Datensatz z.B. durch Extraktion aus WordNet und/oder anderen Quellen aufzubauen sowie die Ähnlichkeit der Wörter (z.B. durch Nutzung der weiteren Informationen in WordNet) zu bestimmen. Hierfür können verschiedene Ähnlichkeitsmaße untersucht werden. Mit Machine Learning kann der Zusammenhang zwischen den compounds und ihren constituents gelernt und zur Vorhersage genutzt werden. Hierbei ergeben sich eine Vielzahl spannender Fragestellungen, von denen dann einige nach Asprache näher untersucht werden sollen.

Ansprechpartner:

Bereich:

Shortcuts
	Transaktionsverwaltung
	DBS-Praktikum
	Abschlussarbeiten

Heinrich-Heine-Universität Düsseldorf

Analyzing Set Expansion as a Method for Sense Disambiguation in Compound words

Datenbanken und Informationssysteme

Lehrstuhlinhaber

Prof. Dr. Stefan Conrad

Sekretariat

Lisa Lorenz