Forschende wollen Siri und Alexa Mundart beibringen

26. Mai 2021, 09:15
  • innovation
  • künstliche intelligenz
  • hochschule
image

In einem Projekt werden Deutsch­schweizer Dialekte gesammelt, um Trainings­daten zu generieren. Eine solche Datenbank soll es von andern bereits geben.

Mit Siri und Alexa sprechen, wie einem der Schnabel gewachsen ist: Das ist bei Schweizer Mundart kaum möglich, weil die Software die Dialekte häufig nicht versteht. Es fehlten die notwendigen, grossen Mengen an Trainingsdaten für Modelle. Für Google, Amazon und Co. sei der Schweizer Markt schlicht zu klein, heisst es nun von Forschenden der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und der Fachhochschule Nordwestschweiz (FHNW).
Sie rufen zu einer Datensammlung von Schweizer Dialekten aus der gesamten Deutschschweiz auf. Mindestens 2000 Stunden Aufnahmen sollen zusammenkommen, erhofft sich der ZHAW-Forscher Mark Cieliebak.
Basierend auf den Daten soll eine Software trainiert werden, um schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln, wie Manfred Vogel von der FHNW erläutert. Der Einsatz dafür ist vielfältig: automatische Transkriptionen, Schweizerdeutsche Befehle für Sprachassistenten, automatisierte Auswertung von Kundenfeedback oder Umfragen oder auch die Untertitelung von Filmen, nennen die Projektbeteiligten.
Eine solche Datenbank wird auch von anderen aufgebaut: Die beiden Schweizer Spezialisten für Sprachlösungen Spitch und Recapp IT wollen diese unter "transkriptionsstandard.ch" der Öffentlichkeit zugänglich machen, wenn es Resultate der Zusammenarbeit gibt. Dies kündigten die Firmen im letzten Sommer an. Beide geben an, ihre Lösungen würden bereits Schweizerdeutsch verstehen.
Das neue Hochschul-Projekt steht hingegen noch ganz am Anfang: Die Forschenden haben eine Webapplikation entwickelt, bei der Freiwillige hochdeutsche Sätze in ihre Mundart übersetzen können. Für den Satz "Sie stieg aus dem Auto und sah sich erstaunt um" könne man zum Beispiel sagen: "Si esch usem outo uusgstege ond hed baff omegluegt", heisst es auf der Projektwebsite. Die Audioaufnahmen fliessen in eine Datenbank und lassen sich von anderen überprüfen, um eine gute Qualität zu erzielen. Die Datensammlung soll für Forschungszwecke zugänglich gemacht werden. 

Loading

Mehr zum Thema

image

ChatGPT wächst so schnell wie keine App

Der KI-Chatbot bricht Rekorde und verzeichnet 100 Millionen aktive Nutzer innert nur 2 Monaten. Nun soll bald ein Abo-Modell eingeführt werden.

publiziert am 2.2.2023
image

ChatGPT: OpenAI entwickelt KI, um eigene KI zu entlarven

Die Firma hat ein neues Tool auf den Markt gebracht, das erkennen soll, ob ein Text von einem Menschen oder einer KI geschrieben wurde.

publiziert am 1.2.2023
image

Hunderte Software-Entwickler sollen ChatGPT trainieren

Wird einfaches Codeschreiben bald obsolet? OpenAI und Microsoft möchten ChatGPT beibringen, beim Schreiben von Code wie ein Mensch vorzugehen.

publiziert am 31.1.2023
image

Steht das Vorzeige-Startup Ava vor dem Aus?

Die ehemalige Ava-Chefin Lea von Bidder hat den neuen Eigentümer betrieben. Der Chef von Femtec Health reagiert mit Drohungen.

publiziert am 30.1.2023