Sprachdokumentation und Spracharchivierung

Mit dem Forschungsthema Sprachdokumentation und –archivierung will das ZAS seine Expertise im Bereich der fachgerechten Dokumentation kleiner Sprachen und der theoriegeleiteten sprachvergleichenden Auswertung bestehender Korpora weiterentwickeln. In diesem Zusammenhang wird ein Konzept zur langfristigen Archivierung von linguistischen Korpora kleiner und in vielen Fällen bedrohter Sprachen und von Sprachdaten anderer Natur erarbeitet und erprobt. Dies erfolgt in enger Zusammenarbeit mit dem IDS und anderen Korpusinitiativen in Deutschland und international. Die Zusammenarbeit mit dem ELAR-Archiv (SOAS London) hat sich hier als besonders vielversprechend entwickelt (Leiterin: Dr. Mandana Seyfeddinipur). Das Forschungsthema wird in enger Zusammenarbeit mit anderen Forschungsthemen durchgeführt, um einerseits die fachgerechte Archivierung anderer Arten von Sprachdaten einzubeziehen, und um andererseits Dokumentationskorpora zu kleinen Sprachen für vielfältige theoretische Fragestellungen zugänglich zu machen.

Das Forschungsthema wird durch verschiedene Drittmittelprojekte unterstützt, eines davon ist das DFG-Heisenberg-Projekt Neue empirische Sprachwissenschaft durch Verbindung von Sprachdokumentation, vergleichender Korpuslinguistik, Typologie und Sprachkontaktforschung (Seifart). Weiterhin stellt das deutsch-französische DFG-ANR-Projekt Sprachvergleichende Phonetik und Morphologie mit einem zeit-alinierten Referenzkorpus aus Dokumentationen von 50 Sprachen: Big Data on Small Languages (Seifart, Krifka, Fuchs, Paschen) ein proof-of-concept für die Entwicklung von Referenzkorpora zu kleinen Sprachen dar. Das BMBF-geförderte Kooperationsprojekt Quality - Established: Erprobung und Anwendung von Kurationskriterien und Qualitätsstandards für audiovisuelle, annotierte Sprachdaten (Krifka, Seifart, Seyfeddinipur, von Prince, Nordhoff) (mit IDS, Universität zu Köln, Universität Hamburg, in Kooperation mit MPI-TLA Nijmegen und SOAS London) entwickelt Kriterien für die Nachnutzbarkeit von Korpora nicht nur für die Linguistik, sondern zum Beispiel auch für Museen und Sprechergemeinschaften. Innerhalb des SFB 'Register' werden in dem Projekt Die Wahl sprachlicher Mittel durch Sprecher*innen in Kreol-Kontexten: Bislama and Morisien (Krifka & Veenstra) Dokumentationskorpora zu zwei Kreolsprachen in Mauritius und Vanuatu erstellt und archiviert.