Universität Wien

100145 SE-B Bachelorseminar Sprachwissenschaft (2025S)

Digitale Linguistik - Datenbanken in der sprachwissenschaftlichen Forschung

10.00 ECTS (2.00 SWS), SPL 10 - Deutsche Philologie
Prüfungsimmanente Lehrveranstaltung

An/Abmeldung

Hinweis: Ihr Anmeldezeitpunkt innerhalb der Frist hat keine Auswirkungen auf die Platzvergabe (kein "first come, first served").

Details

max. 25 Teilnehmer*innen
Sprache: Deutsch

Lehrende

Termine (iCal) - nächster Termin ist mit N markiert

  • Montag 03.03. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 10.03. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 17.03. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 24.03. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 31.03. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 07.04. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 28.04. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 05.05. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 12.05. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 19.05. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 26.05. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 02.06. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 16.06. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5
  • Montag 30.06. 09:45 - 11:15 Seminarraum 4 Hauptgebäude, Tiefparterre Stiege 9 Hof 5

Information

Ziele, Inhalte und Methode der Lehrveranstaltung

Digitale Datenbanken spielen eine zunehmende Rolle in der sprachwissenschaftlichen Forschung. Die Entitäten, die in solchen Datenbanken gesammelt werden, und die Merkmale, die man ihnen zuordnet können unterschiedlichster Natur sein: In der Psycholinguistik etwa werden für die Verarbeitung von Wörtern relevante Kennzahlen gesammelt (z.B. MRC Psycholinguistic Database), der World Atlas of Language Structures sammelt strukturelle Informationen von Sprachen und Datenbanken wie das Irvine Phonotactic Online Dictionary bieten phonologische Informationen, etwa zur Erstellung von Pseudowortlisten. All diese Datenbanken haben gemeinsam, dass sie Information aus mehreren Datenquellen zusammen führen.

Dieses Seminar bietet eine Einführung in das Arbeiten mit linguistischen relationalen Datenbanken, deren Struktur und Abfragemethoden. Mit Hilfe der Script- bzw. Abfragesprachen R und SQL (und der Entwicklungsumgebung RStudio) werden SQLite-Datenbanken erstellt und manipuliert, um Eigenschaften von Daten zueinander in Beziehung zu setzen. Dazu werden in der Lehrveranstaltung Grundlagen zu R und das durch Künstliche Intelligenz unterstützte Programmieren behandelt.

Im Rahmen der Bachelorarbeit soll eine eigene neue Datenbank erstellt werden, die Informationen aus mehreren Quellen zusammenführt. Die schriftliche Bachelorarbeit an sich umfasst eine detaillierte Motivation und Beschreibung der Datenbank sowie ein Anwendungsbeispiel.

Die quantitativen Inhalte des Seminars setzen ein dahingehendes Grundverständnis voraus (Prozentrechnen, Wahrscheinlichkeiten, etc.; Matura-Niveau). Erfahrung mit R oder SQL wird nicht vorausgesetzt. Die begleitende Mitbelegung der Vorlesung "Quantitative Methoden in den Digital Humanities" wird in dieser Hinsicht empfohlen, ist aber keine Voraussetzung für das Seminar.

Art der Leistungskontrolle und erlaubte Hilfsmittel

Mitarbeit und Beteiligung an Diskussionen zur verlangten Lektüre, Erstellung einer Projektskizze, Durchführung eines BA-Projektes und dessen Dokumentation im Rahmen einer schriftlichen Bachalorarbeit, Gruppenreferat zu einer sprachwissenschaftlichen digitalen Datenbank. Gewichtung nach folgendem Schlüssel:

- Mitarbeit und kleine Übungen (20%)
- Projektskizze (5%)
- Referat (15%)
- Arbeit (60%)

Die Zuhilfenahme generativer AI ist per se nicht untersagt, muss aber exakt und nachvollziehbar in einem separaten Anhang (Hilfsmittelverzeichnis) dokumentiert werden (siehe ‘Living guidelines for responsible use of generative AI in research’: https://www.nature.com/articles/d41586-023-03266-1).

Schriftliche Beiträge aller Lehrveranstaltungstypen der SPL 10 können einer automatischen Plagiatsprüfung unterzogen werden; dazu zählen insbesondere Arbeiten der Pro-, Bachelor- und Masterseminarstufe, aber auch Lehrveranstaltungsprüfungen (z.B. Vorlesungsprüfung) und Teilprüfungen (z.B. Zwischentest, 'Hausübungen').

Mindestanforderungen und Beurteilungsmaßstab

- 90-100%: Sehr gut
- 80-89%: Gut
- 70-79%: Befriedigend
- 60-69%: Genügend
- <60%: Nicht genügend

Prüfungsimmanente Lehrveranstaltungen aus dem Angebot der SPL10 sind grundsätzlich anwesenheitspflichtig. Maximal zweimaliges Fehlen ist erlaubt. Eine konsequenzlose Abmeldung ist bei wöchentlichen Lehrveranstaltungen bis vor der dritten LV-Einheit möglich, bei 14-tägigen Lehrveranstaltungen und Blöcken bis vor dem zweiten Termin.

Umfang der Abschlussarbeiten: Bachelorarbeiten 30 Seiten Haupttext

Das Hauptgewicht der Beurteilung liegt auf der schriftlichen Bachelorarbeit.

Prüfungsstoff

In der Lehrveranstaltung durchgenommene Inhalte (inkl. Literatur).

Literatur

Butler, C. (1985). Statistics in linguistics. Blackwell.
Jannidis , F., et al. (eds.) (2017). Digital Humanities. Metzler.
Sauer, S. (2017). Moderne Datenanalyse mit R. Springer.
Schabus, D., Skowron, M., & Trapp, M. (2017). One million posts: A data set of German online discussions. In Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 1241-1244).


Zuordnung im Vorlesungsverzeichnis

Letzte Änderung: Di 11.02.2025 09:26