Universität Wien FIND

270148 PR Data science in metabolomics and proteomics (2020W)

3.00 ECTS (3.00 SWS), SPL 27 - Chemie
Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 12 Teilnehmer*innen
Sprache: Deutsch

Lehrende

Termine

Diese LV wird geblockt in der Woche vom 16. 11.-20. 11. zwischen 9:00-16:00 stattfinden, wobei Studierende ab 11:00 selbstständig arbeiten sollen. Diese LV findet digital statt: es wird sowohl vorab aufgezeichnete Videos und auch live Vorträge geben (Moodle/BBB). Studierende werden einen Großteil selbstständig arbeiten. Je nach Bedarf kann es zusätzliche Zusammenkünfte zwischen einzelnen oder allen Teilnehmerinnen und Teilnehmern geben kann


Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Diese Lehrveranstaltung findet auf Englisch statt.

Ziele: Moderne LC-HRMS basierte Metabolomics- oder Proteomics-Studien generieren umfangreiche, mehrere GB große Datensätze. Speziell in hypothesengenerierenden Forschungsprojekten ist es unmöglich diese Rohdaten händisch oder manuell zu analysieren, um sie zu verstehen und neue biologische Hypothesen daraus abzuleiten. Hierfür benötigt es automatisierte, maßgeschneiderte Softwaretools und Programme, sowie ein Verständnis für deren Arbeitsweise und Routinen.
In dieser LV erlangen die Studierenden einen Einblick in diese automatisch Datenauswertung von LC-HRMS Datensätzen. Anhand eines Metabolomicsdatensatzes erlernen die Studierenden, wie die Auswertung (Peakpicking, Gruppieren, optionales Retentionszeitalignment, Integration der Peakflächen) mittels XCMS in der Statistikumgebung und Programmiersprache R zu implementieren ist. Sie verstehen und optimieren die unterschiedlichen Parameter der dafür notwendigen Funktionen und können die Ergebnisse visualisieren und kritisch beurteilen. Anschließend führen die Studierenden ein Abgleich der detektierten Substanzen mit einer Datenbank durch und exportieren die detektierten Substanzen. Ein kurzer Überblick über gängige uni- und multivariate statistische Methoden soll den Studierenden weitere statistische Auswertemöglichkeiten demonstrieren.

Inhalte: In dieser Lehrveranstaltung werden folgende Themen(gebiete) vorgestellt bzw. gemeinsam erarbeitet.
• Einführung in die Programmiersprache R
• Einlesen der LC-HRMS Datensätze in R
• Prozessieren der Datensätze mit XCMS und CAMERA
• Verständnis für unterschiedliche Einstellungen der XCMS Parameter
• Annotation der detektierten Substanzen gegen eine Substanzdatenbank
• Export der detektierten Substanzen in Form einer Datenmatrix
• Kurzer Überblick über gängige statistische Methoden zur weiteren Auswertung der Datensätze
Die Lehrveranstaltung gliedert sich in einen Vorlesungsteil, in dem die erforderlichen Kenntnisse vermittelt werden, und in einen Übungsteil, der dazu dient, diese Kenntnisse praktisch zu vertiefen.

Methode: Die Inhalte der Lehrveranstaltungen werden durch Vorträge, praktische Übungen, Präsentationen, Diskussionen, mündliche Präsentationen, Gruppenarbeiten, etc. erarbeitet.

Anmerkungen:
Die Studierenden werden eine zentrale R-Installation (R-Studio Server) verwenden. Es ist ein Laptop in die LV mitzubringen, der mit dem Uninetzwerk verbunden werden kann.

Vorkenntnisse:
• Sicherer Umgang mit PCs
• Sicherer Umgang mit MS Office Excel im Speziellen mit Formeln

Art der Leistungskontrolle und erlaubte Hilfsmittel

Art der Leistungskontrolle:
• Mitarbeit
• Schriftlicher Abschlusstest über die (vorgetragenen) Inhalte
• Präsentation der erarbeiteten Auswertung der Demodatensätze

Zur Sicherung der guten wissenschaftlichen Praxis kann die Lehrveranstaltungsleitung Studierende zu einem notenrelevanten Gespräch einladen, welches positiv zu absolvieren ist.

Erlaubte Hilfsmittel: R-Dokumentation (offline)

Mindestanforderungen und Beurteilungsmaßstab

Die Anwesenheit bei der ersten Einheit des Seminars ist verpflichtend. Die Anwesenheit muss zu 75% erfüllt sein, was XX entschuldigten Fehleinheiten entspricht.

Für das Erreichen einer positiven Note müssen 50% der maximal möglichen Punktezahl erreicht werden. Jede Teilleistung muss zum Abschluss der Lehrveranstaltung erbracht werden.

Beurteilungsmaßstab:
Es können 100 Punkte für diese LV erreicht werden. Diese sind aufteilt in:
• Mitarbeit: 30 Punkte
• Abschlusstest: 40 Punkte
• mündliche Präsentation: 30 Punkte

Die Notenvergabe verläuft nach folgendem Punkteschema:
• 1 (sehr gut): 100 - 89 Punkte
• 2 (gut): 88 - 76 Punkte
• 3 (befriedigend): 75 - 63 Punkte
• 4 (genügend): 62 - 50 Punkte
• 5 (nicht genügend): 49 - Punkte
(Es wird zugunsten der Studentin/des Studenten gerundet)

Prüfungsstoff

Der Inhalt der Einheiten und Übungen.

Literatur

Für die Programmiersprache R gibt es eine Vielzahl an frei zugänglichem Material im Internet. Es wird empfohlen, diese Tutorials vorab zu studieren um einen (sicheren) Umgang mit R zu erlangen. Eine Auswahl ist:
https://www.statmethods.net/r-tutorial/index.html
https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf

Für XCMS und CAMERA sind folgende Publikationen und Literatur ein guter Einstieg. Diese sind hier abrufbar:
https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-9-504
https://pubs.acs.org/doi/10.1021/ac202450g
https://www.bioconductor.org/packages/release/bioc/vignettes/CAMERA/inst/doc/CAMERA.pdf

Zuordnung im Vorlesungsverzeichnis

AN-2, BC-1, CHE II-1

Letzte Änderung: Mi 03.02.2021 09:31