Universität Wien
Achtung! Das Lehrangebot ist noch nicht vollständig und wird bis Semesterbeginn laufend ergänzt.

250166 VO Mathematics of Vision and Reinforcement Learning (2023W)

3.00 ECTS (2.00 SWS), SPL 25 - Mathematik
VOR-ORT

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

Sprache: Englisch

Prüfungstermine

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Freitag 06.10. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 13.10. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 20.10. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 27.10. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 03.11. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 10.11. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 17.11. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 24.11. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 01.12. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 15.12. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 12.01. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 19.01. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock
  • Freitag 26.01. 08:00 - 09:30 Hörsaal 11 Oskar-Morgenstern-Platz 1 2.Stock

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

This course will cover the mathematics of reinforcement learning with application to computer vision.

The goal of the course: We describe how RL is modeled as an optimization problem. We discuss both theoretical solutions and study the most popular algorithms used in practice. We consider applications to games and computer vision.

Topics covered in the course will include:
1. Markov Decision Process and the modeling of an RL problem
2. Value-based learning approaches
3. Policy gradient estimation
4. Practical policy optimization methods such as TRPO and PPO.
5. Games and multiple agents
6. Computational geometry and some SLAM

There is no official textbook for the class. Some references:
• Reinforcement Learning: An Introduction, Sutton and Barto, 2nd Edition. This is available for free here and references will refer to the final pdf version available here.
• Emma Brunskil’s course here. (note there are also YouTube videos of this course)
• David Silver's course on Reiforcement Learning [link]

Art der Leistungskontrolle und erlaubte Hilfsmittel

To get a grade on the course, you must either:
• submit a course project/paper followed by an interview.
• Successfully pass a final exam

Mindestanforderungen und Beurteilungsmaßstab

• Basic Probability and Statistics (Markov Process)
• Basics of optimization (constraint optimization, cost functions, gradient decent etc.)
• Familiarity with machine learning will be useful but not necessary.

Prüfungsstoff

Literatur


Zuordnung im Vorlesungsverzeichnis

MAMV

Letzte Änderung: Fr 05.04.2024 08:46