136102 UE Statistics and Machine Learning for (Computational) Linguists (2025S)
Prüfungsimmanente Lehrveranstaltung
Labels
An/Abmeldung
Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").
- Anmeldung von Do 06.02.2025 08:00 bis Mi 26.02.2025 23:59
- Abmeldung bis Mo 31.03.2025 23:59
Details
max. 25 Teilnehmer*innen
Sprache: Englisch
Lehrende
Termine (iCal) - nächster Termin ist mit N markiert
- Freitag 07.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 14.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 21.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 28.03. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 04.04. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 11.04. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- N Freitag 02.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 09.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 16.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 23.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 30.05. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 06.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 13.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 20.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
- Freitag 27.06. 09:45 - 11:15 Seminarraum 6 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
Information
Ziele, Inhalte und Methode der Lehrveranstaltung
Art der Leistungskontrolle und erlaubte Hilfsmittel
Course evaluation will consist of a combination of in-class participation (20%) and homework assignments (80%).There are 3 types of exercises in this course:
• theoretical questions
• pen-and-paper calculation exercises
• programming tasks (Python!)
• theoretical questions
• pen-and-paper calculation exercises
• programming tasks (Python!)
Mindestanforderungen und Beurteilungsmaßstab
Attendance is required; regular participation is the key to completing the course; all students must provide their computing environment; homework assignments must be submitted on time.
Prüfungsstoff
There is no examination for the course.
Literatur
Christopher Butler: Statistics in Linguistics, 1985.
Zuordnung im Vorlesungsverzeichnis
DH-S II
S-DH Cluster I: Language and Literature
S-DH Cluster I: Language and Literature
Letzte Änderung: Mi 29.01.2025 14:06
• Computer literacy (e.g. Computational Background Skills for Digital Humanities (EC))
• Introduction to DH Tools and Methods (Skills I)
• Data Structures and Data Management in the Humanities (Skills I)The contents covered in the course are:Descriptive Statistics
• Levels of measure
• Measures of central tendencies
• Normal distribution
• Correlation (both Pearson and Spearman)
• Interreliability (Cohen’s/Fleiss Kappa)
Inferential Statistics
• Concept of statistical significance testing
Basic probability theory
• Naïve Bayes
• Pointwise Mutual Information
Machine Learning
• Introduction of the concept of supervised machine learning
• Overfitting
• Logistic Regression
• Feature Engineering
• Vector space models/word embeddings