Themenerkennung in Twitter
Im Rahmen dieser Bachelorarbeit soll das soziale Netzwerk Twitter auf auftretende Trends (z.B. in Form von Hashtags) untersucht werden. Das Ziel der Arbeit sind die Entwicklung und der Vergleich von Verfahren zur automatischen Themenerkennung von Tweets und die Bildung eines "Gesamtthemas" aller Tweets desselben Hashtags.
Dadurch sollen bei realen Ereignissen textuelle Beschreibungen, basierend auf den Tweets, zurückgeliefert werden. Beispielsweise sollten die zu entwickelnden Verfahren in der Lage sein, den häufig auf Twitter kommentierten Tod des Schauspielers Paul Walker zu erkennen.
Die Arbeit umfasst grob diese Teilaufgaben:
- Entwicklung von Verfahren zur Themenerkennung aus Tweets
- Aggregation von extrahierten Thema zu dem wahrscheinlichsten Diskussionsthema
- Identifikation von Twitter APIs, inklusive kurzem Vergleich
- Verwendung eines Part-of-Speech Taggers, der ein Modell für Twitter anbietet (z.B. TweeboParser)
- Suche oder Zusammentragen geeigneter Hashtags inklusive Tweets für eine abschließende Evaluation
- gute Programmierkenntnisse in C# (bevorzugt) oder Java
- selbstständiges Arbeiten
- hohe Motivation
Kategorisierung der Arbeit:
Theorie (Analyse): 3/4
Praktisch (Implementation): 4/4
Literatur: 2/4
Ansprechpartner: echo $arbeit[3]." ".$arbeit[4]?>
Bereich: