Universität Wien

052813 VU Scientific Data Management (2019S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Dienstag 05.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 07.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 14.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 19.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 21.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 26.03. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 28.03. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 02.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 04.04. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 09.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 11.04. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 30.04. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 02.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 07.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 09.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 14.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 16.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 21.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 23.05. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 28.05. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 04.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 06.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 13.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 18.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Dienstag 25.06. 15:00 - 16:30 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 27.06. 08:00 - 09:30 Hörsaal 2, Währinger Straße 29 2.OG

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung vermittelt zentrale Methoden für Organisation und Analyse von großen wissenschaftlichen Datenbeständen: verteilte Datenrepositories, Index- und Zugriffstrukturen, Hashing- und Clusteringtechniken. In Programmierübungen lernen die Studierenden Möglichkeiten der Unterstützung von Ähnlichkeitssuche und Data Mining auf großen Daten kennen z.B. Parallelisierung (MapReduce, SPARK) und Filter-refinement-Techniken.

Fachliche Ziele
- wissenschaftliche Daten analysieren und interpretieren,
- Ergebnisse der Analyse bewerten,
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren,
- Anwender unterstützen und beraten.

Überfachliche Ziele
- Teamarbeit,
- Verbesserung der Programmierkenntnisse,
- Verständnis für Zusammenspiel von Data Mining und Scientific Computing.

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern
Bearbeitung von Programmieraufgaben in Gruppen
Abschlusstest

Mindestanforderungen und Beurteilungsmaßstab

Es wird empfohlen, dass die folgenden Kurse vor dieser LV abgeschlossen werden:
- Algorithmen und Datenstrukturen
- Datenbanksysteme
- Software Engineering
- Einführung in Scientific Computing
- Netzwerktechnologien

- 20% Übungsblätter (Hausaufgaben, welche individuell gelöst werden, Vorlesungsfolien können verwendet werden)

- 40% Programmierübungen im Team
(Hilfsmittel: API, Vorlesungsfolien)

- 40% schriftlicher Abschlusstest (ohne Hilfsmittel)

Anwesenheit in den Vorlesungen ist verpflichtend.

>87,00 % 1
zwischen 75,00 % und 86,99 %: 2
zwischen 63,00 % und 74,99 %: 3
zwischen 50,00 % und 62,99 %: 4
< 50% : 5

Prüfungsstoff

Clustering:
- K-means und Varianten
- dichtebasiertes Clustering
- auf massiv großen Daten
MapReduce
Apache Spark
Merkmalsräume
Hashing (LSH)
Indexing
Granger Causality

Literatur

Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen.
J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets.
J. Han, M. Kamber, J.Pei.Data Mining: Concepts and Techniques.
I. H. Witten , E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques.

Zuordnung im Vorlesungsverzeichnis

Module: SDM

Letzte Änderung: Mo 07.09.2020 15:30