Knowledge Discovery in Databases (WS 2009/2010)
Inhalt
- Data Mining Prozess
- Clustering
- Klassifikation
- Assoziationsregeln
- Ausblick auf weitere Verfahren
Teilnahmevoraussetzung
Die Veranstaltung ist für das Master-Studium Informatik konzipiert und setzt somit i.Allg. den Bachelor-Abschluss voraus. Inhaltlich ist ein erfolgreiches Absolvieren des Moduls "Datenbanksysteme" Voraussetzung. Die Belegung dieser Veranstaltung als Zusatzleistung im Bachelor-Studiengang Informatik ist generell nur möglich, wenn die Grundlagenmodule Informatik I bis IV erfolgreich absolviert wurden.
Für die Gestaltung eines Schwerpunktfachs "Datenbanken und Informationsysteme" im Master-Studium beachten Sie bitte auch die Hinweise auf unserer Seite mit der Lehrplanung.
Folien / Skript
Zu der Vorlesung gibt es eine umfangreiche Sammlung von Folien, die
hier im Laufe des Semesters sukzessive (möglichst rechtzeitig vor der
jeweiligen Vorlesungsstunde) zur Verfügung gestellt werden.
| Nr |
Kapitel |
Download |
Vorlesungs- datum |
last update |
| 0 |
Vorspann/Organisatorisches |
PDF |
12.10.2009 |
08.10.2009 |
| 1 |
Einleitung |
PDF |
12.10.2009 |
08.10.2009 |
| 2 |
Statistik - Grundlagen |
PDF |
19.10.2009 |
16.10.2009 |
| 3 |
Clustering |
PDF |
26.10.2009 |
29.10.2009 |
| 4 |
Klassifikation |
PDF |
16.11.2009 |
16.10.2009 |
Organisation
| Veranstaltung |
Zeit |
Ort |
| Vorlesung |
Mo, 14 - 16 Uhr
|
Hörsaal 5H
|
| Übung/Seminar |
Mo, 16 - 18 Uhr
|
Raum 25.12.02.33
|
Weitere organisatorische Hinweise werden hier rechtzeitig (kurz vor Beginn des Vorlesungsbetriebs) veröffentlicht.
Übung/Seminar
Die erfolgreiche und aktive Teilnahme an den Übungen sowie an anschließendem Seminar gelten als Zulassungsvoraussetzungen zur Abschlußprüfung. Die Übungsblätter mit den zu bearbeitenden Aufgaben werden jeweils ab Montag auf der Homepage der Voranstaltung zum Download angeboten. Die Aufgaben sind in Gruppen von
zwei Personen zu bearbeiten und
vor Beginn der Übungsstunde abzugeben. Spätere Abgaben werden nicht mehr akzeptiert! Die Übungsaufgaben werden stichprobenartig korrigiert. Für die Zulassung zur Abschlußprüfung müssen mindestens zwei von drei korrigierten Übungszetteln mit einem "OK" bewertet worden sein.
In der Übung selbst wird für jede Aufgabe ein Bearbeiter ausgelost. Ist ein ausgeloster Übungsteilnehmer unvorbereitet oder abwesend, so kann sie/er insgesamt einmal aussetzen (ein weiteres Aussetzen führt zum Ausschluß aus der Veranstaltung). Vorrechnen heißt nicht eine "perfekte" Lösung vorstellen, sondern die Lösungsidee präsentieren und diese gemeinsam in der Gruppe ausdiskutieren.
Die Seminarthemen sowie weitere Informationen zum Ablauf des Seminars werden Anfang Dezember an dieser Stelle veröffentlicht.
| Übungsblatt |
Download |
Ausgabedatum |
Abgabedatum |
Besprechung |
| Blatt 1 |
PDF |
19.10.2009 |
26.10.2009 |
26.10.2009 |
| Blatt 2 (mit k-means Methode) |
PDF |
26.10.2009 |
02.11.2009 |
02.11.2009 |
| Blatt 3 |
PDF |
02.11.2009 |
09.11.2009 |
09.11.2009 |
| Blatt 4 |
PDF |
09.11.2009 |
16.11.2009 |
16.11.2009 |
| Blatt 5 |
PDF |
16.11.2009 |
23.11.2009 |
23.11.2009 |
Literatur
- M. Ester, J. Sander: Knowledge Discovery in Databases: Techniken und Anwendungen. Springer-Verlag 2000
- M.H. Dunham: Data Mining - Introductory and Advanced Topics. Prentice Hall / Pearson, 2003
- P.-N. Tan, M. Steinbach, V. Kumar: Introduction to Data Mining. Addison Wesley / Pearson 2006
- J. Han, M. Kamber: Data Mining: Concepts and Techniques. Morgan Kaufmann Publ., 2006