Praktikum Knowledge Discovery in Databases
Aktuelles
Inhalt
Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Meßverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekomunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.
Mit der Lösung dieser Probleme beschäftigt sich daher das vergleichsweise junge Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, des maschinellen Lernens, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.
Während die Vorlesung den Schwerpunkt auf den Data Mining Schritt setzt, widmet sich das Praktikum dem gesamten KDD-Prozess. Anhand von konkreten Problemstellungen werden die Teilnehmer verschiedenste Werkzeuge der (semi-)automatischen Wissensextraktion aus großen Datenmengen kennen und einsetzen lernen.
Neben einem abgeschlossenen Vordiplom ist der Erwerb eines Scheines in der Vorlesung "Knowledge Discovery in Databases" Voraussetzung. Des Weiteren ist es hilfreich, über Kenntnisse aus den Vorlesungen "Index- und Speicherungsstrukturen für Datenbanksysteme", "Maschinelles Lernen" sowie "Datenbanksysteme I" zu verfügen.
Organisation
- Umfang: 4 Semesterwochenstunden
- Ansprechpartner:
Zeit und Ort
Veranstaltung | Zeit | Ort | Beginn |
---|
Vorkenntnisse
- Neben einem abgeschlossenen Vordiplom ist der Erwerb eines Scheines in der Vorlesung "Knowledge Discovery in Databases I" Voraussetzung. Des Weiteren ist es hilfreich, über Kenntnisse aus den Vorlesungen "Index- und Speicherungsstrukturen für Datenbanksysteme", "Maschinelles Lernen und Data Mining" sowie "Datenbanksysteme I" zu verfügen.
Teilnahme
Ablauf
Links
Data Mining Software:
- Weka 3: Data Mining Software in Java
- Weka 3: API Dokumentation
- Download Weka Version, die im KDD-Praktikum eingesetzt wird.
- YALE Data Mining
- Download YALE Data Mining Software und Dokumentation
Java: