Wissenschaftler des Herder-Instituts der Universität Leipzig, des Instituts für Deutsche Sprache in Mannheim und des Hamburger Zentrums für Sprachkorpora der Universität Hamburg wollen in einem neuen Forschungsprojekt die gesprochene Sprache durch neue Automatisierungswerkzeuge weiter erschließen.
Das Projekt „Zugang zu multimodalen Korpora gesprochener Sprache“ (ZuMult) wird von der Deutschen Forschungsgemeinschaft (DFG) für drei Jahre gefördert. Am Herder-Institut der Universität Leipzig wurden in verschiedenen Forschungsprojekten umfangreiche Sammlungen gesprochener Sprache (Korpora) erarbeitet und aufbereitet. Diese dienen der Erforschung der gesprochenen Sprache in der Linguistik und können Lehrern und Wissenschaftlern Beispiele für die Sprachverwendung in bestimmten kommunikativen Situationen liefern.
Doch noch ist die Suche in diesen Sammlungen sehr aufwendig. Sie ist nur für Spezialisten möglich, und es fehlen wichtige Automatisierungsinstrumente. „Wir wollen nun Wege finden, wie man die Sprachkorpora nach bestimmten Parametern gliedern und durchsuchen kann“, erklärt Prof. Christian Fandrych vom Herder-Institut. Das sei der Kern von „ZuMult“. Neben Fandrych sind an dem Projekt Dr. Thomas Schmidt vom Institut für Deutsche Sprache in Mannheim und Dr. Kai Wörner vom Hamburger Zentrum für Sprachkorpora der Universität Hamburg beteiligt. Auch in Mannheim und Hamburg stehen Nutzern Korpora gesprochener Sprache zur Verfügung. In einem vorangegangenen Projekt (GeWiss) wurden am Herder-Institut insgesamt gut 140 Stunden Sprachdaten in der Wissenschaftskommunikation aufgenommen, transkribiert und weiter aufbereitet.
Die lautgetreuen Verschriftungen sind nötig, um die Daten überhaupt durchsuchbar zu machen. Die Sammlung besteht aus mündlichen Prüfungen, Referaten in Seminaren und den sich anschließenden Diskussionen sowie Vorträgen von Wissenschaftlern. Diese authentischen kommunikativen Ereignisse ermöglichen es unter anderem Sprachlehrern, Lernende auf spezifische Situationen vorzubereiten.
Prof. Christian Fandrych vom Herder-Institut nennt ein Beispiel: „Prüfungsgespräche laufen in verschiedenen Sprachen und Kulturen unterschiedlich ab. Wie muss ich mich als Prüfling präsentieren, welcher Kommunikationsstil ist üblich? Diese Fragen lassen sich für die deutsche Sprache mithilfe der Beispiele erläutern.“
Eine weitere Nutzergruppe sind Linguisten, die an diesen Sprach- und Textsammlungen untersuchen, wie die gesprochene Sprache beschaffen ist, welche Worte mündlich anders realisiert werden als es ihr Schriftbild nahelegt (zum Beispiel verkürzt oder verschliffen werden) und wie sich die Umgangssprache strukturiert. Praktiker nutzen diese Quellen bereits. Doch sie wünschen sich, schneller und einfacher gute Beispiele in den Sammlungen zu finden und wollen diese etwa nach Schwierigkeit gewichtet haben, ergaben Befragungen im Vorfeld des Projektstarts. Die bereits aktiven Nutzer wünschen sich darüber hinaus einen weiteren Ausbau der Korpussammlung, um ein noch vielfältigeres Bild der gesprochenen Sprache zu erhalten. Das ist eine Aufgabe für die Zukunft – eine solche Ausweitung der Datenbasis ist sehr aufwendig.
Keine Kommentare bisher