Universität Wien

052311 VU Data Mining (2021W)

Prüfungsimmanente Lehrveranstaltung
GEMISCHT

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

Dienstag 05.10. 15:00 - 16:30 Digital
Donnerstag 07.10. 08:00 - 09:30 Digital
Dienstag 12.10. 15:00 - 16:30 Digital
Donnerstag 14.10. 08:00 - 09:30 Digital
Dienstag 19.10. 15:00 - 16:30 Digital
Donnerstag 21.10. 08:00 - 09:30 Digital
Donnerstag 28.10. 08:00 - 09:30 Digital
Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7
Donnerstag 04.11. 08:00 - 09:30 Digital
Dienstag 09.11. 15:00 - 16:30 Digital
Donnerstag 11.11. 08:00 - 09:30 Digital
Dienstag 16.11. 15:00 - 16:30 Digital
Donnerstag 18.11. 08:00 - 09:30 Digital
Dienstag 23.11. 15:00 - 16:30 Digital
Hörsaal 5 ZfT Philippovichgasse 11, 1.OG
Donnerstag 25.11. 08:00 - 09:30 Digital
Dienstag 30.11. 15:00 - 16:30 Digital
Donnerstag 02.12. 08:00 - 09:30 Digital
Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7
Dienstag 07.12. 15:00 - 16:30 Digital
Donnerstag 09.12. 08:00 - 09:30 Digital
Dienstag 14.12. 15:00 - 16:30 Digital
Donnerstag 16.12. 08:00 - 09:30 Digital
Dienstag 11.01. 15:00 - 16:30 Digital
Donnerstag 13.01. 08:00 - 09:30 Digital
Dienstag 18.01. 15:00 - 16:30 Digital
Donnerstag 20.01. 08:00 - 09:30 Digital
Dienstag 25.01. 15:00 - 16:30 Digital
Donnerstag 27.01. 08:00 - 09:30 Digital
Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung wird in einem hybriden Modus abgehalten. Die Vorlesungen werden online über Big Blue Button gehalten, aufgezeichnet und in Moodle zur Verfügung gestellt. Wir planen Frage-und-Antwort-Runden zu den Programmieraufgaben sowie die beiden Klausuren vor Ort durchzuführen soweit es die Situation erlaubt.
Wichtig: Die erste Einheit am Dienstag, dem 05.10.2021, um 15:00 Uhr wird online abgehalten. Big Blue Button Link für die erste Einheit: https://moodle.univie.ac.at/mod/bigbluebuttonbn/guestlink.php?gid=zJv4ph9GNUEt

Die Vorlesung deckt wesentliche Inhalte des Data-Mining und Maschinellen Lernens ab und behandelt aktuelle Forschung zu folgenden Themen:
1. Clustering
2. Natural language processing
3. Lernverfahren für Graphen
4. Multi-view learning

Fachliche Ziele:
- Wissenschaftliche Daten analysieren und interpretieren
- Ergebnisse der Analyse bewerten
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren
- Anwender unterstützen und beraten

Überfachliche Ziele:
- Teamarbeit
- Verbesserung der Programmierkenntnisse
- Verständnis für Zusammenspiel von Data-Mining und anderen Disziplinen

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern (Einzelleistung)
Bearbeitung von Programmieraufgaben (Gruppenarbeit)
Gegenseitige Beurteilung (Einzelleistung)
Zwischen- und Abschlusstest (Einzelleistung)

Mindestanforderungen und Beurteilungsmaßstab

Der erfolgreiche Abschluss von FDA (052300 VU Foundations of Data Analysis) oder ein Nachweis von entsprechenden Vorkenntnissen werden für die Teilnahme vorausgesetzt. Erfahrung in der Programmiersprache Python wird erwartet.

Prüfungsteile:
40% Übungsblätter
30% Programmierübungen im Team, sowie gegenseitige Beurteilung
30% Zwischen- und Abschlusstest

Um den Kurs erfolgreich abzuschließen müssen mindestens 30% der Punkte in jedem Teil erreicht werden.

Notenskala:
>87,00 % 1
zwischen 75,00 % und 86,99 %: 2
zwischen 63,00 % und 74,99 %: 3
zwischen 50,00 % und 62,99 %: 4
< 50% : 5

Prüfungsstoff

- Dimensionsreduktion
- Clustern von hochdimensionalen Daten (Subspace Clustering, Deep Clustering)
- Sequence-to-Sequence Lernverfahren
- Text Mining
- Sentiment Analysis
- Kernel Methods
- Data Mining und Lernverfahren für Graphen (Graph Kernels, Graph Neural Networks)
- Data Streams (Clustering and Classifcation)
- Granger Causality (updated, 17. Dezember 2021)

Und eventuell andere Themen wie:
- Multi-View, Multi-Instance Learning
- Gradient Boosting Trees

Literatur

Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques
Tan P.-N., Steinbach M., Kumar V. Introduction to Data Mining
Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen
Goodfellow, Ian, et al. Deep Learning
Shai Shalev-Shwartz, Shai Ben-David: Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press 2014
Nils M. Kriege, Fredrik D. Johansson, Christopher Morris: A Survey on Graph Kernels, Applied Network Science, Machine learning with graphs, 5:6, 2020
Karsten M. Borgwardt, M. Elisabetta Ghisu, Felipe Llinares-López, Leslie O'Bray, Bastian Rieck: Graph Kernels: State-of-the-Art and Future Challenges. Found. Trends Mach. Learn. 13(5-6) (2020)

Zuordnung im Vorlesungsverzeichnis

Module: DM

Letzte Änderung: Fr 12.05.2023 00:13