Forschungsprojekt ATOM

Automatische Themenverfolgung und Opinion Mining für eine Medienresonanzanalyse

pressrelations ZIM

Das Forschungsprojekt ATOM ist ein Kooperationsprojekt zwischen dem Lehrstuhl für Datenbanken und Informationssysteme und der pressrelations GmbH. Ziel des Projekts ist es, die Erfassung und Analyse von Medieninhalten textueller Berichte und Beiträge stärker zu automatisieren. Dadurch kann der bislang noch überwiegend manuelle und somit arbeitsintensive Codierprozess von Medienberichten (Human Coding) sukzessive durch digitale, automatisierte Methoden zur Textanalyse (Text Mining) unterstützt werden.

Im Vordergrund stehen dabei die praktische Nutzbarmachung von Forschungsergebnissen aus dem Bereich Opinion Mining (automatische Meinungsanalyse) und Themenverfolgung im Kontext einer Medienresonanzanalyse.

Gefördert wird das Projekt durch das Bundesministerium für Wirtschaft und Technologie im Zentralen Innovationsprogramm Mittelstand (ZIM). Das Projekt wird mit dem Maximalbetrag für Kooperationsprojekte zwischen KMU und Forschungseinrichtungen gefördert. Die Laufzeit der Forschungsförderung beträgt zweieinhalb Jahre.

Start des Projektes: 1. Juli 2011

Aktuelle Meilensteine: M2 (Opinion Mining), M3 (Themenverfolgung)

Abgeschlossene Meilensteine: M1 (Opinion Mining)

Aktueller Fortschritt:
02.07.2012: Die Testumgebung (Paket 5) wurde implementiert. Nach der abgeschlossenen „Evaluierung der Merkmale“ (Paket 4b) werden die Projektmitglieder der Universität Düsseldorf den Meilenstein M2 beginnen, um den Klassifikationsprozess mit einer weiterlernenden Komponente auszustatten, während pressrelations mit der Themenverfolgung (Meilenstein M3) beginnt.
11.06.2012: Heute erscheint eine erste wissenschaftliche Publikation zu diesem Projekt. T. Scholz, S. Conrad, I. Wolters: Comparing Different Methods for Opinion Mining in Newspaper Articles In: Proc. of the 17th International conference on Applications of Natural Language Processing to Information Systems 2012, (NLDB 2012), Groningen, The Netherlands.
02.01.2012: Das Paket 2b ("Extraktion von Merkmalen für eine breite Bedeutungspalette"), Paket 3 ("Entwicklung eines Mathematischen Modells zur Gewichtung") und das Paket 4a ("Generierung eines Wörterbuches") sind erfolgreich umgesetzt worden und werden nun evaluiert.
22.11.2011: Heute findet innerhalb der Veranstaltung "Innovationsforum - Science meets Industry" (organisiert von der DIWA) ein Votrag zum Thema "Opinion Mining für eine Medienresonanzanalyse" statt.
21.10.2011: Das Paket 2a "Extraktion von Tonalitätswörtern" ist erfolgreich als Rapidminer-Operator implementiert worden. Außerdem wurden schon erste Teilspezifikationen des Arbeitspaketes 2b ("Extraktion von Merkmalen für eine breite Bedeutungspalette") umgesetzt.
01.09.2011: Das erste Modul "Information Extraction" (zugleich auch Arbeitspaket 1 - Anbindung an das Information Extraction Modul) wurde erfolgreich abgeschlossen. Alle Ergebnisse des Extraktionsmodules können nun von Rapidminer-Operatoren verwendet und weiterverarbeitet werden.


Kontaktperson für weitere Informationen: Thomas Scholz

Links: pressrelations GmbH
Pressemitteilung der DIWA


Stand: 02.07.2012


Heinrich Heine Universität

Datenbanken und Informationssysteme

Lehrstuhlinhaber

Prof. Dr. Stefan Conrad


Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.24
Tel.: +49 211 81-14088
Fax: +49 211 81-13463

Sekretariat

Sabine Freese


Sprechzeiten:
Mo-Fr: 10:00-11:30 Uhr
Mo-Do: 13:00-14:30 Uhr


Universitätsstr. 1
40225 Düsseldorf
Gebäude: 25.12
Etage/Raum: 02.22
Tel.: +49 211 81-11312
Fax: +49 211 81-13463
Verantwortlich für den Inhalt:  E-Mail senden WE Informatik