Modulname |
Digitale Analyse großer Textkorpora |
Gebiet |
|
Profil |
Profil Praxis
Profil Freie Studien
|
CPs |
5 CP |
Campus |
Hier geht
es zum Vorlesungsverzeichnis |
Voraussetzungen |
keine |
Besonderheiten |
TN-Plätze 10/25 Termin 1. Sitzung 16.09.2024, 10.00-16.00 Uhr, GB03/149 Die Anmeldung erfolgt über Campus auf Modulebene. Anmeldung ist bereits offen Zusammensetzung der Endnote 100% aus Benotung einer individuellen Programmieraufgabe (Teil 1) mit Projektbeschreibung basierend auf einer der Inputsitzungen (Teil 2) Prüfungstermin 15.03.2025 |
Blockseminar |
Nein |
Vorkenntnisse |
|
Veranstaltungszeit |
Freitag 10:00 - 13:00 |
Dozenten |
Oliver Deck |
Arbeitsaufwand |
Teil 1: 60h Präsenz, 15h Eigenarbeit Teil 2: 21h Präsenz, 54h Eigenarbeit |
Literatur |
Webseite des DAGT-Kurses Jünger, J. and Gärtner, C., 2023. Computational Methods für die Sozial- und Geisteswissenschaften (p. 462). Springer Nature. https://link.springer.com/book/10.1007/978-3-658-37747-2 |
Modulteil |
[050010] Digitale Analyse großer Textkorpora - WS 24/25 |
Modultyp |
|
Modulanbieter |
Fakultät für Philologie |
Inhalt |
Teil 1: DAGT - Python für die Analyse von Textkorpora (Blockkurs) , WS24/25, GB03/149, 16.-22. und 23-27.09.2024 10:00-16:00 Uhr Teil 2: DAGT - Inputsitzungen (Vortrag + betreute Programmieraufgaben), WS24/25, GB03/149, jeden 2. Freitag 10:00-13:00 Uhr, Erste Sitzung: 25.10.2024 Das Modul zielt darauf ab, Studierende zu befähigen, selbstständig Programmierprojekte im Bereich der Textkorpora durchzuführen. Hierfür werden im ersten Teil grundlegende Programmierkenntnisse in Python im Rahmen eines Blockkurses vermittelt. Diese haben einen starken Fokus auf Methoden und Bibliotheken zur Textanalyse. Im zweiten Modulteil erhalten die Studierenden in sieben Inputsitzungen Einblicke in unterschiedliche Anwendungsgebiete der digitalen Textanalyse, wie z.B. Social-Media-Analyse, Webscraping, Korpusanalyse historischer Textdaten, etc. Dozierende aus unterschiedlichen Instituten der Philologie präsentieren ihre aktuelle Forschung im ersten Teil jeder Inputsitzung, während die Studierenden im zweiten Teil themenbezogene Programmieraufgaben bearbeiten. Die Prüfungsleistung (wahlweise benotet) besteht aus der Bearbeitung von erweiterten Programmieraufgaben zu einer der Inputsitzungen mit abschließendem schriftlichen Projektbericht. Inhaltliche Beschreibung Teil 1: 14-tägiger Python-Blockkurs in Präsenz für Studierende ohne Vorkenntnisse. Erlernen grundlegender Konzepte der Programmierung mit Python, sowie spezifischer Methoden zum Umgang mit (großen) Textdaten. Der Kurs wird ergänzt durch bereits existierende Selbstlern-Materialien. Inhaltliche Beschreibung Teil 2 : Im zweiten Teil präsentieren Dozierende aus unterschiedlichen Bereichen der Geisteswissenschaften ihre textbezogene Forschung. Dieser Einblick in die Anwendungsmöglichkeiten der in Teil 1 erlernten Fähigkeiten wird durch begleitende Programmieraufgaben untermauert, die von den Studierenden jeweils im zweiten Part jeder Sitzung bearbeitet werden. |
Lernziele |
Lernziele: Nach Absolvieren des Moduls kennen die Studierenden die für das eigene Fach relevanten Methoden und digitalen Tools im Umgang mit großen Korpora und haben auch Einblick erhalten in die Fragestellungen und Verfahrensweisen benachbarter Fächer: Sie verfügen über Anwendungskenntnisse in der Programmiersprache Python mit Fokus aufs Thema "korpusanalytische Verfahren" und sind vertraut mit der Nutzung von Python-Bibliotheken (Pandas, Spacy, etc.). Sie sind imstande, Textkorpora zusammenzustellen und verfügbar zu machen. Sie kennen Bearbeitungsmöglichkeiten für komplexe Korpora (z.B. Transkription oraler oder sprachlich heterogener Korpora, multimodale Korpora, Übersetzung). Sie haben verschiedene Datenerhebungs-, -aufbereitungs- und -analyseverfahren kennengelernt: z.B. Webscraping, Tokenisierung, Annotation, Kookkurrenz-, Frequenzanalyse. |