Vergleich von Sentence Splittern auf deutschsprachigen Textkorpora
Eine gute Natural Language Pipeline bildet in vielen Text Mining-Anwendungen die Grundlage für qualitativ hochwertige Ergebnisse. Einen Grundbaustein bilden dabei Sentence Splitter, welche für das Identifizieren der einzelnen Sätze eines gegebenen Texts verantwortlich sind. Es gibt eine Vielzahl von Sentence Splittern, welche unterschiedlich arbeiten. Das Ziel dieser Bachelorarbeit ist der Vergleich verschiedener Sentence Splitter auf deutschsprachigen Korpora mit anschließender Interpretation um Stärken und Schwächen aufzuzeigen.
Diese Arbeit umfasst die folgenden Punkte:
- Einarbeitung in die Funktionsweise verschiedener Sentence Splitter
- Training der Sentence Splitter auf verschiedenen deutschsprachigen Korpora
- Evaluation und Bewertung der Performance der Sentence Splitter auf verschiedenen deutschsprachigen Korpora
Ansprechpartner: echo $arbeit[3]." ".$arbeit[4]?>
Bereich: