-Zurück-

Vergleich von Sentence Splittern auf deutschsprachigen Textkorpora

Motivation:

Eine gute Natural Language Pipeline bildet in vielen Text Mining-Anwendungen die Grundlage für qualitativ hochwertige Ergebnisse. Einen Grundbaustein bilden dabei Sentence Splitter, welche für das Identifizieren der einzelnen Sätze eines gegebenen Texts verantwortlich sind. Es gibt eine Vielzahl von Sentence Splittern, welche unterschiedlich arbeiten. Das Ziel dieser Bachelorarbeit ist der Vergleich verschiedener Sentence Splitter auf deutschsprachigen Korpora mit anschließender Interpretation um Stärken und Schwächen aufzuzeigen.

Aufgabenstellung:

Diese Arbeit umfasst die folgenden Punkte:

Ansprechpartner:

Bereich:

Heinrich Heine Universität

Datenbanken und Informationssysteme

Lehrstuhlinhaber

Prof. Dr. Stefan Conrad


Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.24
Tel.: +49 211 81-14088

Sekretariat

Lisa Lorenz



Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.22
Tel.: +49 211 81-11312
Verantwortlich für den Inhalt:  E-Mail senden Datenbanken & Informationssysteme