Knowledge Discovery in Databases I im WS 2010/11
Aktuelles
- Liste der erfolgreich angemeldeten Teilnehmer, siehe Klausur.
- Die Anmeldung zur Klausur ist nicht mehr möglich, siehe Klausur.
- Einsichtnahme der Klausurkorrektur am 25.03.2011, 13:15-14:00, Raum 156 (Oettingenstrase 67).
- Vorläufige Notenliste hängt im Schaukasten des Lehrstuhls (Oettingenstr. 67)
- Scheine können im Sekretariat abgeholt werden. Beachten Sie bitte die Öffnungszeiten: Sekretariat (Susanne Grienberger)
Inhalt
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Messverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.
Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, dem maschinellen Lernen, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.
Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in so genannten Data Warehouses gesondert verwaltet werden. Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.
Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assozationsregeln.
Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.
Organisation
- Umfang: 3+2 Semesterwochenstunden
- Vorlesung: PD Dr. Peer Kröger, Dr. Arthur Zimek
- Vorkenntnisse: wünschenswert: Datenbanksysteme I
- Übungen: PD Dr. Peer Kröger, Dr. Arthur Zimek
Zeit und Ort
Veranstaltung | Zeit | Ort | Beginn |
---|---|---|---|
Vorlesung | Do, 9.00 - 12.00 Uhr | Raum 002 (Schellingstr. 3) | 21.10.2010 |
Übung |
Fr, 12.30 - 14.00 Uhr | Raum M 001 (Hauptgebäude) | 29.10.2010 |
Übung |
Fr, 14.05 - 16.00 Uhr | Raum M 001 (Hauptgebäude) |
29.10.2010 |
Vorlesungsplan
Datum | Vorlesung | Datum | Übung |
21.10.2010 | Kapitel 1: Einleitung PDF | 22.10.2010 | entfällt |
28.10.2010 | Kapitel 2: Featureräume PDF | 29.10.2010 | Blatt01.pdf |
04.11.2010 | Kapitel 3: Klassifikation (1-4) PDF | 05.11.2010 | Blatt02.pdf |
11.11.2010 | Kapitel 3: Klassifikation (1-4, Fortsetzung) | 12.11.2010 | Blatt03.pdf |
18.11.2010 | Kapitel 3: Klassifikation (5-6) PDF | 19.11.2010 | Blatt04.pdf |
25.11.2010 | Kapitel 3: Klassifikation (7) PDF Kapitel 4: Regression PDF | 26.11.2010 | Blatt05.pdf |
02.12.2010 | Kapitel 5: Clustering (1-2) PDF | 03.12.2010 | Blatt06.pdf |
09.12.2010 | Kapitel 5: Clustering (2-3) PDF | 10.12.2010 | Blatt07.pdf, loesung7-2.pdf |
16.12.2010 | Kapitel 5: Clustering (4) PDF | 17.12.2010 | Blatt08.pdf, |
13.01.2011 | Kapitel 6: Outlier Detection (1-5) PDF | 14.01.2011 | Blatt09.pdf |
20.01.2011 | Kapitel 6: Outlier Detection (6-7) PDF Kapitel 7: Assoziationsregeln PDF | 21.01.2011 | Blatt10.pdf |
27.01.2011 | Kapitel 8: DB-Techniken zur Leistungssteigerung PDF | 28.01.2011 | Blatt11.pdf |
03.02.2011 | Kapitel 9: Evaluation von unsupervised Verfahren PDF | 04.02.2011 | Blatt12.pdf |
Klausur
Die Klausur zur Vorlesung findet am 10.02.2011, voraussichtlich zwischen 10:00 und 12:00 Uhr statt.
Bitte melden Sie sich hier zur Klausur für KDD I im WS 10/11 an, wenn Sie sich entschlossen haben, bei der Klausur mitzuschreiben: Anmeldung
Die Anmeldung ist abgeschlossen, erfolgreich angemeldet sind Matrikelnummern.
Beachten Sie bitte das Merkblatt zur Klausur: Merkblatt
Einsichtnahme der Klausurkorrektur am 25.03.2011, 13:15-14:00, Raum 156 (Oettingenstrase 67).
Weiterführende Informationen
KDD zum Ausprobieren
- Weka 3: Data Mining Software in Java
- Rapid Miner (früher YALE)
- ELKI: Environment for DeveLoping KDD-Applications Supported by Index-Structures
weitere Informationen
Vorhergehende Semester
SS 15, SS 14, SS 13, SS 12, SS 11, WS 10/11, WS 09/10, WS 08/09, WS 07/08, WS 06/07, WS 05/06, WS 04/05, WS 03/04, WS 02/03, WS 00/01, WS 99/00