Universität Wien

136102 UE Statistics and Machine Learning for (Computational) Linguists (2025S)

Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Englisch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Freitag 07.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 14.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 21.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 28.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 04.04. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 11.04. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 09.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 16.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 23.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 30.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 06.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 13.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 20.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Freitag 27.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

This course gives a basic introduction to statistical methods for (computational) linguists.

Requirements:
• Computer literacy (e.g. Computational Background Skills for Digital Humanities (EC))
• Introduction to DH Tools and Methods (Skills I)
• Data Structures and Data Management in the Humanities (Skills I)

The contents covered in the course are:

Descriptive Statistics
• Levels of measure
• Measures of central tendencies
• Normal distribution
• Correlation (both Pearson and Spearman)
• Interreliability (Cohen’s/Fleiss Kappa)
Inferential Statistics
• Concept of statistical significance testing
Basic probability theory
• Naïve Bayes
• Pointwise Mutual Information
Machine Learning
• Introduction of the concept of supervised machine learning
• Overfitting
• Logistic Regression
• Feature Engineering
• Vector space models/word embeddings

Art der Leistungskontrolle und erlaubte Hilfsmittel

Course evaluation will consist of a combination of in-class participation (20%) and homework assignments (80%).

There are 3 types of exercises in this course:
• theoretical questions
• pen-and-paper calculation exercises
• programming tasks (Python!)

Mindestanforderungen und Beurteilungsmaßstab

Attendance is required; regular participation is the key to completing the course; all students must provide their computing environment; homework assignments must be submitted on time.

Prüfungsstoff

There is no examination for the course.

Literatur

Christopher Butler: Statistics in Linguistics, 1985.

Zuordnung im Vorlesungsverzeichnis

DH-S II
S-DH Cluster I: Language and Literature

Letzte Änderung: Mi 29.01.2025 14:06