Leibniz-Zentrum Allgemeine Sprachwissenschaft Leibniz-Gemeinschaft

Big Data zu kleinen Sprachen: Veröffentlichung der DoReCo-Online-Datenbank

20.07.2022

Am 29. Juli treffen sich Linguist:innen aus aller Welt am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin, um die Online-Veröffentlichung der DoReCo-Datenbank zu feiern. Die Datenbank bietet Zugang zu Audioaufnahmen von mehr als 50 Sprachen, zusammen mit Transkriptionen, Übersetzungen und detaillierten linguistischen Analysen. Der Eintritt zu der hybriden Veranstaltung ist frei, eine Anmeldung ist jedoch erforderlich. Journalist:innen sind zudem eingeladen, die DoReCo-Projektleiter im Vorfeld zwischen 14 und 15 Uhr zu treffen. Weitere Informationen befinden sich am Ende der Pressemitteilung.

Die Online-Datenbank des Projekts DoReCo (Language Documentation Reference Corpus) bietet ein unvergleichliches Panorama der Vielfalt der Sprachen der Welt durch mündliche Erzählungen von Nordsibirien bis Südafrika und von Europa bis Australien. DoReCo enthält eine Auswahl der besten Ergebnisse akribischer Arbeit von Sprachwissenschaftler:innen, die jahrelang kleine und bedrohte Sprachen analysiert haben in Zusammenarbeit mit deren Sprecher:innen. Mit DoReCo haben nun Wissenschaftler:innen aus der ganzen Welt Zugang zu diesen Aufnahmen und Analysen. Der Blick durch dieses Kaleidoskop von Sprachen wird helfen, die Geheimnisse der sprachlichen Vielfalt zu entschlüsseln, aber auch ihre gemeinsamen Merkmale hervorzuheben, die trotz der Unterschiedlichkeiten bestehen.

Frank Seifart, wissenschaftlicher Mitarbeiter am ZAS und Leiter des DoReCo-Projekts, kommentiert: "Ich freue mich sehr darüber, dass wir die Vielfalt der menschlichen Sprachen nun nicht mehr nur anhand von abstrakten Aussagen aus Grammatikbüchern untersuchen können, sondern durch die reiche Ausdruckskraft spontan produzierter Sprache."

DoReCo hat ein Netz von fast hundert Linguist:innen aufgebaut, die sprachliche Primärdaten gesammelt und analysiert haben. Die Verarbeitung dieser Daten wurde durch ein deutsch-französisches Projekt ermöglicht, das vom ZAS in Berlin und dem Dynamic Du Langage Institut in Lyon geleitet und gemeinsam von der deutschen DFG und der französischen ANR (Agence Nationale de la Recherche) finanziert wurde. Drei Jahre lang hat das Projektteam die vielfältigen Transkriptionen, Übersetzungen und linguistischen Analysen erweitert und vereinheitlicht, um vergleichende Analysen damit zu ermöglichen. Die DoReCo-Daten entsprechen den ethischen und wissenschaftlichen OpenData Prinzipien.

Die DoReCo-Sammlung von 50 Sprachen ist die bisher größte und repräsentativste Stichprobe der 7.000 noch gesprochenen menschlichen Sprachen bezüglich audiovisuell aufgezeichneter und von Experten analysierter Texte. Im Vergleich zu den bisher zur Verfügung stehenden Ressourcen stellt dies für die Wissenschaftler:innen einen erheblichen Durchbruch dar, denn Daten zu den meisten DoReCo-Sprachen waren für die Forschung bisher bestenfalls nur mühsam auffindbar. Die Veröffentlichung mündlicher Aufnahmen in Verbindung mit umfangreichen linguistischen Analysen eröffnet neue Wege für die Erforschung der einzigartigen menschlichen Fähigkeit, erstaunlich vielfältige Sprachsysteme zu entwickeln, zu erhalten und zu verwenden. Für die DoReCo-Sprachen Dalabon (in Australien gesprochen), Resígaro (in Südamerika gesprochen) und Kamas (in Sibirien gesprochen) ist die Zahl der Sprecher:innen jedoch bereits dramatisch zurückgegangen, so dass es heute nur noch eine Handvoll, nur noch einen oder gar keine Sprecher:innen mehr gibt. Dies führt unweigerlich dazu, dass sich die Fenster, die sie zur kulturellen und sprachlichen Vielfalt der Menschheit geöffnet haben, bald schließen, wodurch sich die Bedeutsamkeit des von DoReCo bereitgestellten dokumentarischen Materials noch erhöht.

Veranstaltung:
Freitag 29.7.2022, 15:00 - 17:30 Uhr, hybrid am Leibniz Zentrum Allgemeine Sprachwissenschaft, Schützenstr. 18, 10117 Berlin. Teilnahme kostenlos, Registrierung bitte bis zum 22.7.2022 unter https://www.leibniz-zas.de/de/das-zas/veranstaltungen/details/events/new-doreco-inauguration-ceremony

Für Journalist:innen:
Journalist:innen sind eingeladen, sich zwischen 14 und 15 Uhr im Vorfeld der Veranstaltung mit den Projektleitern zu treffen. Für die Teilnahme schreiben Sie bitte bis zum 27. Juli eine E-Mail an Frank Seifart (seifart@leibniz-zas.de) oder François Pellegrino (francois.pellegrino@univ-lyon2.fr). Es ist möglich, persönlich oder per Zoom teilzunehmen.

Über DoReCo
Die DoReCo-Datenbank wurde im Rahmen des DoReCo-Projekts von 2019 bis 2022 erstellt. Dieses Projekt wurde durch ein ANR-DFG-Stipendium (ANR-18-FRAL-0010-01, KR951/17-1) finanziert, das an Frank Seifart, Manfred Krifka (März bis Juli 2019) und François Pellegrino (August 2019 bis August 2022) vergeben wurde. Das Projekt war am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin und am Laboratoire Dynamique Du Langage (UMR5596, CNRS & Université Lyon 2) in Lyon angesiedelt und kooperierte mit dem Bayerischen Archiv für Sprachsignale, München. Ziel des DoReCo-Projekts war die Erforschung lokaler Variationen der Sprechgeschwindigkeit auf der Grundlage einer bisher breitesten Stichprobe der Sprachen der Welt.


Wissenschaftliche Ansprechpartner:
Frank Seifart
seifart@leibniz-zas.de
Phone: +49 30 20192 407

François Pellegrino
francois.pellegrino@univ-lyon2.fr


Weitere Informationen:
https://doreco.info Webseite des Projekts