Universität Wien

052813 VU Scientific Data Management (2018S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

Donnerstag 01.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 06.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 08.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 13.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 15.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 20.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 22.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 10.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 12.04. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 17.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 19.04. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 24.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 26.04. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 03.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 08.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 15.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 17.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 24.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 29.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 05.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 07.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 12.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 14.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 19.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 21.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
Dienstag 26.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
Donnerstag 28.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung vermittelt zentrale Methoden für Organisation und Analyse von großen wissenschaftlichen Datenbeständen: verteilte Datenrepositories, Index- und Zugriffstrukturen, Hashing- und Clusteringtechniken. In Programmierübungen lernen die Studierenden Möglichkeiten der Unterstützung von Ähnlichkeitssuche und Data Mining auf großen Daten kennen z.B. Parallelisierung (MapReduce, SPARK) und Filter-refinement-Techniken.

Fachliche Ziele
- wissenschaftliche Daten analysieren und interpretieren,
- Ergebnisse der Analyse bewerten,
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren,
- Anwender unterstützen und beraten.

Überfachliche Ziele
- Teamarbeit,
- Verbesserung der Programmierkenntnisse,
- Verständnis für Zusammenspiel von Data Mining und Scientific Computing.

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern
Bearbeitung von Programmieraufgaben in Gruppen
Abschlusstest

Mindestanforderungen und Beurteilungsmaßstab

Es wird empfohlen, dass die folgenden Kurse vor dieser LV abgeschlossen werden:
- Algorithmen und Datenstrukturen
- Datenbanksysteme
- Software Engineering
- Einführung in Scientific Computing
- Netzwerktechnologien

- 20% Übungsblätter (Hausaufgaben, welche individuell gelöst werden, Vorlesungsfolien können verwendet werden)

- 40% Programmierübungen im Team
(Hilfsmittel: API, Vorlesungsfolien)

- 40% schriftlicher Abschlusstest (ohne Hilfsmittel)

Anwesenheit in den Vorlesungen ist verpflichtend.

>87,00 % 1
zwischen 75,00 % und 86,99 %: 2
zwischen 63,00 % und 74,99 %: 3
zwischen 50,00 % und 62,99 %: 4
< 50% : 5

Prüfungsstoff

Clustering:
- K-means und Varianten
- dichtebasiertes Clustering
- auf massiv großen Daten
MapReduce
Apache Spark
Merkmalsräume
Hashing (LSH)
Indexing
Granger Causality

Literatur

Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen.
J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets.
J. Han, M. Kamber, J.Pei.Data Mining: Concepts and Techniques.
I. H. Witten , E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques.

Zuordnung im Vorlesungsverzeichnis

Module: SDM

Letzte Änderung: Mo 07.09.2020 15:30