Maschinelles Lernen und Data Mining im SS 2010
Aktuelles
- Musterlösungen für Übungen gibt es nicht mehr online -- bei Bedarf kontaktieren Sie bitte die Übungsleiter.
- Die mündlichen Prüfungen finden am 20.07.2010 ab 12:30 in Raum 133 in der Oettingenstr. 67 statt.
- Verbindliche Anmeldung für die mündliche Prüfung bitte per Mail an die Übungsleiter bis 16.7.2010
- Achtung: Am Donnerstag den 8.7. findet KEINE Übung statt. Statt dessen am Freitag den 9.7,!
- Am 26 und 27. Mai finden auch keine Übungen statt. In der folgenden Woche, ist die Übung wegen des freien Donnerstags am Freitag den 04.06
- Am 25. Mai findet keine Vorlesung statt!
- Die Vorlesung vom 11.05. entfällt. Deswegen wird auch keine Ersatz-Übung (Feiertag) am darauffolgenden Freitag angeboten. Die nächste Vorlesung findet regulär am 18.05. statt.
- Da nicht genügend Vorlesungsteilnehmer Interesse an dem Freitags-Übungstermin haben, wird in Zukunft keine Freitags-Übung stattfinden.
- Die Vorlesung ist offiziell für den Bachelorstudiengang Informatik zugelassen.
- Die Anmeldung für den Übungsbetrieb und die Klasur ist bis zum 06.07.2010 freigeschaltet und notwendig zur Erlangung eines Scheines. Hierfür ist eine gültige CIP-Kennung nötig.
Inhalt
Ziel des Maschinellen Lernens ist die Entwicklung von Methoden zur Realisierung lernfähiger technischer Systeme. In der Vorlesung werden die wichtigsten Zweige des Maschinellen Lernens vorgestellt:
- Beim überwachten Lernen werden basierend auf vorhandenen Beispieldaten Systeme zur Klassifikation und zur Modellierung funktioneller Abhängigkeiten trainiert (typische Vertreter: Neuronales Netz, Support Vector Machine).
- Das Ziel des unüberwachten Lernens ist es, autonom relevante Strukturen in Daten zu finden (typische Vertreter: Cluster Analyse, Independent Component Analyse).
- Kausal Probabilistische Netze (Bayesian Networks) stellen einen Rahmen zur Beschreibung und zum Erlernen von komplexen probabilistischen Abhängigkeiten dar, bis hin zur Analyse von Kausalität.
- Reinforcement Learning ist das wichtigste Lernverfahren zur Optimierung des Verhaltens von Agenten.
Datamining bezeichnet die Analyse von Datenbanken mit Methoden des Maschinellen Lernens und motiviert Forschungsaktivitäten mit neuen Anforderungen an Skalierbarkeit und Bedienbarkeit der Lösungen. Ein typisches Ziel ist die Nutzbarmachung von Kundendaten (Customer Relationship Management). In der Vorlesung werden eine Reihe von industriellen Anwendungen des Maschinellen Lernens, mit Schwerpunkt auf Anwendungen im Data Mining, vorgestellt.
Organisation
- Umfang: 3+2 Semesterwochenstunden
- Vorlesung: Dr. Volker Tresp
- Vorkenntnisse: Grundstudiumsvorlesungen der Informatik
- Übungen: Franz Graf, Marisa Thoma
- Der Vorlesungsstoff kann in der Hauptdiplomprüfung bei Prof. Dr. Hans-Peter Kriegel geprüft werden. Absprachen mit anderen Prüfern müssen individuell getroffen werden.
Zeit und Ort
Veranstaltung | Zeit | Ort | Beginn |
---|---|---|---|
Vorlesung | Di, 11.00 c.t. - 14.00 Uhr | Raum E 216 (Hauptgebäude) | 20.04.2010 |
Übung |
Do, 12.00 - 14.00 Uhr | Raum 067 (Oettingenstr. 67) | 29.04.2010 |
|
|
Raum 067 (Oettingenstr. 67) |
30.04.2010 |
Planung
Vorlesung | Übung | ||
---|---|---|---|
Datum | Thema | Datum | Blatt |
20.04.10 | Einführung | 22./23.04.2010 | entfällt |
27.04.10 | Das Perceptron / Wiederholung: Lineare Algebra / Lineare Regression | 29./30.04.2010 | optional: R -Einführung (Sourcen)
|
04.05.10 | Basisfunktionen / Neuronale Netze | 06.05.2010 | Blatt 1 (Daten zu 1-3) R-Lösung zu Perzeptron und linearer Algebra |
11.05.10 | entfällt | 14.05.2010 | entfällt |
18.05.10 | Fortsetzung: Neuronale Netze / Kerne / Wiederholung: Wahrscheinlichkeitslehre | 20./21.05.2010 | Blatt 2 |
25.05.10 | entfällt | 27./28.05.2010 | entfällt |
01.06.10 | Frequentistische Statistik und Bayes’sche Statistik / Lineare Klassifikatoren | 04.06.2010 | Blatt 3 |
08.06.10 | Fortsetzung: Lineare Klassifikatoren / Support Vector Machines | 10./11.06.2010 | Blatt 4 (Daten zu 4-3) R-Lösung zu Normalverteilung und Körpergrößen |
15.06.10 | Modellvergleich | 17./18.06.2010 | Blatt 5 (Daten zu 5-1) |
22.06.10 | Hauptkomponentenanalyse | 24./25.06.2010 | Blatt 6 |
29.06.10 | Rekurrente Neuronale Netze und Zeitreihen | 01./02.07.2010 | Blatt 7 data.txt |
06.07.10 | Instanzbasiertes Lernen | Fr. 09.07.2010 | -- |
13.07.10 | Bayes'sche Netze | 15.07.2010 | Blatt 8 |
20.07.10 | mündliche Prüfungen | 22./23.07.2010 |
Übungsbetrieb
Auf dem Merkblatt zum Übungsbetrieb finden sich Informationen zu den Übungsbedingungen sowie das Deckblatt welches allen abgegebenen Übungsblättern anzuheften ist.
Nützliche Links
- Unter http://www.die-informatiker.net bieten Münchner Informatiker ein Diskussionsforum für euch. Dort können Fragen von allgemeinem Interesse gestellt werden und finden oft auch eine Antwort. Wir begrüßen diese Initiative, übernehmen aber keinerlei Verantwortung für den Inhalt.
Vorhergehende Semester
SS 16, SS 15, SS 14, SS 13, SS 12, SS 11, SS 10, SS 09, SS 08, SS 07, SS 06, SS 05, SS 04