Search:
Lehrstuhl  |  Institut  |  Fakultät  |  LMU
print

Knowledge Discovery in Databases I im WS 2009/10



Aktuelles

  • Die Scheine können jetzt in der Oettingenstr. 67 im Sekretariat Raum 154 abgeholt werden.
  • Der Termin für die Einsichtnahme ist jetzt am Do 25.3.2010 um 14.00 im Zimmer F109 (alte RaumNr E.109) in der Oettingenstr. 67.
  • Das Ergebnis der Klausur steht nun fest (Klausurergebnis).
    Falls Sie Ihre Matrikelnummer nicht auf der Liste finden, haben Sie der Veröffentlichung der Note im Internet nicht zugestimmt und können das Ergebnis nur über den Aushang in der Oettingenstr. 67 im Schaukasten vor dem Raum 156 erfahren.
  • ACHTUNG: Die Klausurbesprechung beginnt erst um 9.00 ct.
  • Alle Daten zur Klausur finden Sie auch auf folgendem Merkblatt .
  • Wichtig :Bitte erscheinen sie pünktlich bis spätestens 14.15 zur Klausur am Fr. 5.2. (Hörsaal A140) Hauptgebäude. Sollten Sie bis 14.25 nicht auf Ihren Platz sein, gehen wir davon aus, dass Sie nicht an der Klausur teilnehmen wollen und werden ihren Platz einem anderen Studenten zuweisen.
  • Die Bearbeitungszeit der Klausur ist 2 Stunden. Es sind außer einem nicht-programmierbaren Taschenrechner keine weiteren Hilfsmittel zugelassen. Einlass ist bereits 14.00.
  • Die Klausur findet am Fr. den 05.02. von 14.30-16.30 Uhr im Hörsaal A 140 im Hauptgebäude statt. Die Bearbeitungszeit wird voraussichtlich 2 Stunden betragen.
  • Die Vorlesung beginnt erst um 8.30.



Inhalt

Die in vielen Anwendungsgebieten stark angewachsenen Datenmengen machen eine manuelle Analyse der angefallenen Information zunehmend schwierig, wenn nicht sogar unmöglich. Gerade in Bereichen wie der Auswertung biologischer Messverfahren (Gen-Sequenzierung, Micro-Array Verfahren ...) oder von Transaktionsdaten großer Telekommunikations- oder Netzbetreiber, ist eine Nutzung der Daten ohne die Zuhilfenahme computergestützter Verfahren nicht denkbar.

Mit der Lösung dieser Probleme beschäftigt sich daher das Forschungsgebiet "Knowledge Discovery in Databases (KDD)". Es verbindet dabei Aspekte der Statistik, dem maschinellen Lernen, sowie der Datenbanksysteme und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Der in diesem Zusammenhang häufig verwendete Begriff Data Mining bezieht sich dabei auf den grundlegenden Schritt im KDD-Prozess, in dem die eigentliche Analyse der Daten durchgeführt wird.

Data Mining wird dabei häufig auch auf große Mengen betrieblicher Daten angewendet, die in so genannten Data Warehouses gesondert verwaltet werden. Der häufig verwendete Begriff Business Intelligence beschreibt dann unter anderem die Anwendung von Data Mining Algorithmen auf die von einem Data Warehouse bereitgestellten Informationen, um zielgerichtet Entscheidungsprozesse zu unterstützen.

Die Vorlesung gibt einen Überblick über die Grundlagen der wichtigsten KDD-Techniken. Dabei wird besonders auf die folgenden Teilgebiete eingegangen: Klassifikation, Regression/Trenderkennung, Clustering, Outlier Detection und Assozationsregeln.

Zur Vertiefung der Vorlesung werden 2-stündige Übungen angeboten, in denen die vorgestellten Verfahren weiter erläutert und an praktischen Beispielen veranschaulicht werden.


Organisation


Zeit und Ort

Veranstaltung Zeit Ort Beginn
Vorlesung Do, 8.30 - 11.00 Uhr Raum A 021 (Hauptgebäude) 22.10.2009
Übung
Fr, 12.00 - 14.00 Uhr Raum M 001 (Hauptgebäude) 30.10.2009
Übung
Fr, 14.00 - 16.00 Uhr Raum M 001 (Hauptgebäude)
30.10.2009

Vorlesungsplan

Datum Vorlesung Datum Übung
22.10.2009 Kapitel 1: Einleitung

Kapitel1.pdf

23.10.2009 entfällt
29.10.2009 Kapitel 2: Featureräume Kapitel2.pdf

Kapitel 3: Klassifikation Kapitel3.pdf

30.10.2009 Blatt1.pdf
05.11.2009 Kapitel 3: Klassifikation 06.11.2009 Blatt2.pdf
11.11.2009 Kapitel 3: Klassifikation 12.11.2009 Blatt3.pdf
19.11.2009 Kapitel 3: Klassifikation 20.11.2009 Blatt4.pdf
26.11.2009 Kapitel 3: Klassifikation 27.11.2009 Blatt5.pdf
Loesung_5-3.pdf
03.12.2009 Kapitel 4: Regression Kapitel4.pdf

Kapitel 5: Clustering Kapitel5.pdf

04.12.2009 Blatt6.pdf

Loesung_6-2.pdf

10.12.2009 Kapitel 5: Clustering 11.12.2009 Blatt7.pdf

Loesung_7-1.pdf

17.12.2009 Kapitel 5: Clustering 18.12.2009 Blatt8.pdf

Loesung_8-3.pdf

07.01.2010 Kapitel 6: Outlier Detection Kapitel6.pdf 08.01.2010 Blatt9.pdf

Loesung_9-2.pdf
EMRechner.xls

14.01.2010 Kapitel 6: Outlier Detection 15.01.2010 Blatt10.pdf

Loesung_10.pdf

21.01.2010 Kapitel 7: Assoziationsregeln Kapitel7.pdf 22.01.2010 Blatt11.pdf
28.01.2010 Kapitel 8: DB-Techniken zur Leistungssteigerung Kapitel8.pdf 29.01.2010 Blatt12.pdf
04.02.2010 Fragestunde zur Klausur 05.02.2010 KLAUSUR (14.30 - 16.30)
11.02.2010 Klausurbesprechung und Kapitel 9: Data Warehousing



Anmeldung zur Klausur

Die Anmeldung zur Klausur ist seid dem 5.12.2009 abgeschlossen. Nachmeldungen sind zum jetzigen Zeitpunkt leider nicht mehr möglich.


Weiterführende Informationen

KDD zum Ausprobieren

weitere Informationen



Vorhergehende Semester

SS 15, SS 14, SS 13, SS 12, SS 11, WS 10/11, WS 09/10, WS 08/09, WS 07/08, WS 06/07, WS 05/06, WS 04/05, WS 03/04, WS 02/03, WS 00/01, WS 99/00

blank