Analyzing Set Expansion as a Method for Sense Disambiguation in Compound words
Dieses Thema eignet sich auch gut dafür, zunächst als Projektarbeit begonnen zu werden und dann als Masterarbeit weitergeführt zu werden. Die Aufgabe ergibt sich aus einer Forschungskooperation mit der Anglistik und Computerlinguistik, in der es um den Zusammenhang der Semantik der Komponentenwörter mit dem zusammengesetzten Begriff geht, wofür wir aktuell Machine Learning-Modelle zur Vorhersage verwenden. Es geht in dieser Aufgabe also darum, die semantische Ähnlichkeit von zusammengesetzten Wörtern (compounds; wir untersuchen das vorrangig im Englischen) und ihren Komponenten (constituents) zu untersuchen. Hierzu ist initial ein Datensatz z.B. durch Extraktion aus WordNet und/oder anderen Quellen aufzubauen sowie die Ähnlichkeit der Wörter (z.B. durch Nutzung der weiteren Informationen in WordNet) zu bestimmen. Hierfür können verschiedene Ähnlichkeitsmaße untersucht werden. Mit Machine Learning kann der Zusammenhang zwischen den compounds und ihren constituents gelernt und zur Vorhersage genutzt werden. Hierbei ergeben sich eine Vielzahl spannender Fragestellungen, von denen dann einige nach Asprache näher untersucht werden sollen.
Ansprechpartner: echo $arbeit[3]." ".$arbeit[4]?>
Bereich: