Forschende wollen Siri und Alexa Mundart beibringen

26. Mai 2021 um 09:15
  • innovation
  • hochschule
  • Künstliche Intelligenz
image

In einem Projekt werden Deutsch­schweizer Dialekte gesammelt, um Trainings­daten zu generieren. Eine solche Datenbank soll es von andern bereits geben.

Mit Siri und Alexa sprechen, wie einem der Schnabel gewachsen ist: Das ist bei Schweizer Mundart kaum möglich, weil die Software die Dialekte häufig nicht versteht. Es fehlten die notwendigen, grossen Mengen an Trainingsdaten für Modelle. Für Google, Amazon und Co. sei der Schweizer Markt schlicht zu klein, heisst es nun von Forschenden der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und der Fachhochschule Nordwestschweiz (FHNW).
Sie rufen zu einer Datensammlung von Schweizer Dialekten aus der gesamten Deutschschweiz auf. Mindestens 2000 Stunden Aufnahmen sollen zusammenkommen, erhofft sich der ZHAW-Forscher Mark Cieliebak.
Basierend auf den Daten soll eine Software trainiert werden, um schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln, wie Manfred Vogel von der FHNW erläutert. Der Einsatz dafür ist vielfältig: automatische Transkriptionen, Schweizerdeutsche Befehle für Sprachassistenten, automatisierte Auswertung von Kundenfeedback oder Umfragen oder auch die Untertitelung von Filmen, nennen die Projektbeteiligten.
Eine solche Datenbank wird auch von anderen aufgebaut: Die beiden Schweizer Spezialisten für Sprachlösungen Spitch und Recapp IT wollen diese unter "transkriptionsstandard.ch" der Öffentlichkeit zugänglich machen, wenn es Resultate der Zusammenarbeit gibt. Dies kündigten die Firmen im letzten Sommer an. Beide geben an, ihre Lösungen würden bereits Schweizerdeutsch verstehen.
Das neue Hochschul-Projekt steht hingegen noch ganz am Anfang: Die Forschenden haben eine Webapplikation entwickelt, bei der Freiwillige hochdeutsche Sätze in ihre Mundart übersetzen können. Für den Satz "Sie stieg aus dem Auto und sah sich erstaunt um" könne man zum Beispiel sagen: "Si esch usem outo uusgstege ond hed baff omegluegt", heisst es auf der Projektwebsite. Die Audioaufnahmen fliessen in eine Datenbank und lassen sich von anderen überprüfen, um eine gute Qualität zu erzielen. Die Datensammlung soll für Forschungszwecke zugänglich gemacht werden. 

Loading

Mehr zum Thema

image

Fünf Erfolgsfaktoren für den Einsatz von KI-Agenten

KI-Agenten revolutionieren das Kundenerlebnis: Sie analysieren Daten, erstellen Pläne und handeln überwiegend autonom. KI-Agenten eröffnen Unternehmen neue Möglichkeiten von automatisierten Serviceanfragen bis hin zu komplexen Abläufen, die ohne menschliches Zutun durchgeführt werden.

image

Zwei KI-Pioniere gewinnen Turing Award

Andrew Barto und Richard Sutton erhalten den höchsten Informatikpreis für ihre Forschung im Bereich Reinforcement Learning.

publiziert am 6.3.2025
image

Google erweitert KI-Suche

Mit dem experimentellen KI-Modus entfernt sich Google noch weiter von der traditionellen Suche.

publiziert am 6.3.2025
image

Rätoromanische KI-Sprachmodelle geplant

Der Dachverband Lia Rumantscha hat eine Strategie zur Förderung der rätoromanischen Sprache in der digitalen Welt veröffentlicht. Ein Projekt befasst sich mit einem KI-Sprachmodell.

publiziert am 5.3.2025