Universität Wien

052813 VU Scientific Data Management (2017S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Donnerstag 02.03. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 09.03. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 16.03. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 23.03. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 30.03. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 06.04. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 27.04. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 04.05. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 11.05. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 18.05. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 01.06. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 08.06. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 22.06. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG
  • Donnerstag 29.06. 08:00 - 11:15 Hörsaal 2, Währinger Straße 29 2.OG

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Die Veranstaltung vermittelt zentrale Methoden für Organisation und Analyse von großen wissenschaftlichen Datenbeständen: verteilte Datenrepositories, Index- und Zugriffstrukturen, Hashing- und Clusteringtechniken. In Programmierübungen lernen die Studierenden Möglichkeiten der Unterstützung von Ähnlichkeitssuche und Data Mining auf großen Daten kennen z.B. Parallelisierung (MapReduce, SPARK) und Filter-refinement-Techniken.

Fachliche Ziele
- wissenschaftliche Daten analysieren und interpretieren,
- Ergebnisse der Analyse bewerten,
- Skalierbare Lösungen für große Datenmengen auswählen und implementieren,
- Anwender unterstützen und beraten.

Überfachliche Ziele
- Teamarbeit,
- Verbesserung der Programmierkenntnisse,
- Verständnis für Zusammenspiel von Data Mining und Scientific Computing.

Art der Leistungskontrolle und erlaubte Hilfsmittel

Aktive Mitarbeit
Bearbeitung von Übungsblättern
Bearbeitung von Programmieraufgaben in Gruppen
Abschlusstest

Mindestanforderungen und Beurteilungsmaßstab

Für Bachelor Studenten gilt als Mindestanforderung der erfolgreiche Abschluss von ISE oder PC.
- ISE: Information Management & Systems Engineering
- PC: Parallel Computing

Es wird empfohlen, dass die folgenden Kurse vor dieser LV abgeschlossen werden:
- Algorithmen und Datenstrukturen
- Datenbanksysteme
- Software Engineering
- Einführung in Scientific Computing
- Netzwerktechnologien

20% Übungsblätter
40% Programmierübungen im Team
40% Abschlusstest
Anwesenheit ist Pflicht

Prüfungsstoff

Clustering:
- K-means und Varianten
- dichtebasiertes Clustering
MapReduce
Apache Spark
Merkmalsräume
Indexing Hashing (LSH)
Netzwerkanalyse

Literatur

Ester M., Sander J. Knowledge Discovery in Databases: Techniken und Anwendungen.
J. Leskovec, A. Rajaraman, J. Ullman. Mining of Massive Datasets.
J. Han, M. Kamber, J.Pei.Data Mining: Concepts and Techniques.
I. H. Witten , E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and Techniques.

Zuordnung im Vorlesungsverzeichnis

Module: SDM

Letzte Änderung: Mo 07.09.2020 15:30