Universität Wien

052311 VU Data Mining (2021W)

Prüfungsimmanente Lehrveranstaltung
GEMISCHT

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Dienstag 05.10. 15:00 - 16:30 Digital
  • Donnerstag 07.10. 08:00 - 09:30 Digital
  • Dienstag 12.10. 15:00 - 16:30 Digital
  • Donnerstag 14.10. 08:00 - 09:30 Digital
  • Dienstag 19.10. 15:00 - 16:30 Digital
  • Donnerstag 21.10. 08:00 - 09:30 Digital
  • Donnerstag 28.10. 08:00 - 09:30 Digital
    Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7
  • Donnerstag 04.11. 08:00 - 09:30 Digital
  • Dienstag 09.11. 15:00 - 16:30 Digital
  • Donnerstag 11.11. 08:00 - 09:30 Digital
  • Dienstag 16.11. 15:00 - 16:30 Digital
  • Donnerstag 18.11. 08:00 - 09:30 Digital
  • Dienstag 23.11. 15:00 - 16:30 Digital
    Hörsaal 5 ZfT Philippovichgasse 11, 1.OG
  • Donnerstag 25.11. 08:00 - 09:30 Digital
  • Dienstag 30.11. 15:00 - 16:30 Digital
  • Donnerstag 02.12. 08:00 - 09:30 Digital
    Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7
  • Dienstag 07.12. 15:00 - 16:30 Digital
  • Donnerstag 09.12. 08:00 - 09:30 Digital
  • Dienstag 14.12. 15:00 - 16:30 Digital
  • Donnerstag 16.12. 08:00 - 09:30 Digital
  • Dienstag 11.01. 15:00 - 16:30 Digital
  • Donnerstag 13.01. 08:00 - 09:30 Digital
  • Dienstag 18.01. 15:00 - 16:30 Digital
  • Donnerstag 20.01. 08:00 - 09:30 Digital
  • Dienstag 25.01. 15:00 - 16:30 Digital
  • Donnerstag 27.01. 08:00 - 09:30 Digital
    Hörsaal 42 Hauptgebäude, 2.Stock, Stiege 7

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung wird in einem hybriden Modus abgehalten. Die Vorlesungen werden online über Big Blue Button gehalten, aufgezeichnet und in Moodle zur Verfügung gestellt. Wir planen Frage-und-Antwort-Runden zu den Programmieraufgaben sowie die beiden Klausuren vor Ort durchzuführen soweit es die Situation erlaubt.
Wichtig: Die erste Einheit am Dienstag, dem 05.10.2021, um 15:00 Uhr wird online abgehalten. Big Blue Button Link für die erste Einheit: https://moodle.univie.ac.at/mod/bigbluebuttonbn/guestlink.php?gid=zJv4ph9GNUEt

Die Vorlesung deckt wesentliche Inhalte des Data-Mining und Maschinellen Lernens ab und behandelt aktuelle Forschung zu folgenden Themen:
1. Clustering
2. Natural language processing
3. Lernverfahren für Graphen
4. Multi-view learning

Fachliche Ziele:
- Wissenschaftliche Daten analysieren und interpretieren
- Ergebnisse der Analyse bewerten
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren
- Anwender unterstützen und beraten

Überfachliche Ziele:
- Teamarbeit
- Verbesserung der Programmierkenntnisse
- Verständnis für Zusammenspiel von Data-Mining und anderen Disziplinen

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern (Einzelleistung)
Bearbeitung von Programmieraufgaben (Gruppenarbeit)
Gegenseitige Beurteilung (Einzelleistung)
Zwischen- und Abschlusstest (Einzelleistung)

Mindestanforderungen und Beurteilungsmaßstab

Der erfolgreiche Abschluss von FDA (052300 VU Foundations of Data Analysis) oder ein Nachweis von entsprechenden Vorkenntnissen werden für die Teilnahme vorausgesetzt. Erfahrung in der Programmiersprache Python wird erwartet.

Prüfungsteile:
40% Übungsblätter
30% Programmierübungen im Team, sowie gegenseitige Beurteilung
30% Zwischen- und Abschlusstest

Um den Kurs erfolgreich abzuschließen müssen mindestens 30% der Punkte in jedem Teil erreicht werden.

Notenskala:
>87,00 % 1
zwischen 75,00 % und 86,99 %: 2
zwischen 63,00 % und 74,99 %: 3
zwischen 50,00 % und 62,99 %: 4
< 50% : 5

Prüfungsstoff

- Dimensionsreduktion
- Clustern von hochdimensionalen Daten (Subspace Clustering, Deep Clustering)
- Sequence-to-Sequence Lernverfahren
- Text Mining
- Sentiment Analysis
- Kernel Methods
- Data Mining und Lernverfahren für Graphen (Graph Kernels, Graph Neural Networks)
- Data Streams (Clustering and Classifcation)
- Granger Causality (updated, 17. Dezember 2021)

Und eventuell andere Themen wie:
- Multi-View, Multi-Instance Learning
- Gradient Boosting Trees

Literatur

Han J., Kamber M., Pei J. Data Mining: Concepts and Techniques
Tan P.-N., Steinbach M., Kumar V. Introduction to Data Mining
Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen
Goodfellow, Ian, et al. Deep Learning
Shai Shalev-Shwartz, Shai Ben-David: Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press 2014
Nils M. Kriege, Fredrik D. Johansson, Christopher Morris: A Survey on Graph Kernels, Applied Network Science, Machine learning with graphs, 5:6, 2020
Karsten M. Borgwardt, M. Elisabetta Ghisu, Felipe Llinares-López, Leslie O'Bray, Bastian Rieck: Graph Kernels: State-of-the-Art and Future Challenges. Found. Trends Mach. Learn. 13(5-6) (2020)

Zuordnung im Vorlesungsverzeichnis

Module: DM

Letzte Änderung: Fr 12.05.2023 00:13