Mit Siri und Alexa sprechen, wie einem der Schnabel gewachsen ist: Das ist bei Schweizer Mundart kaum möglich, weil die Software die Dialekte häufig nicht versteht. Es fehlten die notwendigen, grossen Mengen an Trainingsdaten für Modelle. Für Google, Amazon und Co. sei der Schweizer Markt schlicht zu klein, heisst es nun von Forschenden der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und der Fachhochschule Nordwestschweiz (FHNW).
Sie rufen zu einer Datensammlung von Schweizer Dialekten aus der gesamten Deutschschweiz auf. Mindestens 2000 Stunden Aufnahmen sollen zusammenkommen, erhofft sich der ZHAW-Forscher Mark Cieliebak.
Basierend auf den Daten soll eine Software trainiert werden, um schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln, wie Manfred Vogel von der FHNW erläutert. Der Einsatz dafür ist vielfältig: automatische Transkriptionen, Schweizerdeutsche Befehle für Sprachassistenten, automatisierte Auswertung von Kundenfeedback oder Umfragen oder auch die Untertitelung von Filmen, nennen die Projektbeteiligten.
Eine solche Datenbank wird auch von anderen aufgebaut: Die beiden Schweizer Spezialisten für Sprachlösungen Spitch und Recapp IT wollen diese unter "transkriptionsstandard.ch" der Öffentlichkeit zugänglich machen, wenn es Resultate der Zusammenarbeit gibt. Dies kündigten die Firmen im letzten Sommer an. Beide geben an, ihre Lösungen würden bereits Schweizerdeutsch verstehen.
Das neue Hochschul-Projekt steht hingegen noch ganz am Anfang: Die Forschenden haben eine Webapplikation entwickelt, bei der Freiwillige hochdeutsche Sätze in ihre Mundart übersetzen können. Für den Satz "Sie stieg aus dem Auto und sah sich erstaunt um" könne man zum Beispiel sagen: "Si esch usem outo uusgstege ond hed baff omegluegt", heisst es auf der Projektwebsite. Die Audioaufnahmen fliessen in eine Datenbank und lassen sich von anderen überprüfen, um eine gute Qualität zu erzielen. Die Datensammlung soll für
Forschungszwecke zugänglich gemacht werden.