Wie GPT-4 das Rätoromanische retten soll

21. Juli 2023 um 07:58
  • innovation
  • künstliche intelligenz
  • FHNW
  • chatgpt
image
Tarasp Fontana im Unterengadin. Foto: Daniel Schwen unter Lizenz CC BY-SA 4.0

Ein Bot soll helfen, das noch von 7000 Personen gesprochene Idiom Vallader zu fördern und zu bewahren. Der Assistent wurde an der FHNW entwickelt und bereits in Tarasp Fontana getestet.

Die Sprachdominanz in der Schweiz ist deutlich: Über 60% der Bevölkerung spricht hauptsächlich Deutsch, Rätoromanisch hingegen geben gerade mal 0,5% als Hauptsprache an. Rumantsch Grischun hat in der Schweiz aber den Status einer Landessprache. Mit der 1982 geschaffenen Amtssprache kann man also mit den Behörden kommunizieren.
Die knapp 41'000 rätoromanisch sprechenden Einwohnerinnen und Einwohner der Schweiz pflegen aber lokale Idiome mit eigener Grammatik und Wörterbüchern. Tief im Osten im Unterengadin etwa wird von rund 7000 Personen Vallader gesprochen – von Dorf zu Dorf wiederum mit unterschiedlichem Dialekt. Das Idiom sei gefährdet, sagt Oliver Bendel. Der Professor an der Fachhochschule Nordwestschweiz (FHNW) hat einen Chatbot publiziert, der helfen soll, die Sprachgemeinschaft zu unterstützen und Vallader zu bewahren.

GPT-4 kombiniert mit einer Datenbank

Der Entwickler Dalil Jabou hat unter der Aufsicht von Bendel die Software geschrieben, damit diese Deutsch, Englisch und Rätoromanisch als Texteingabe verarbeiten kann und dann Vallader in geschriebener und gesprochener Sprache ausgibt – quasi ein halber Sprachassistent, wie Bendel erklärt. Möglich machte dies GPT-4, das Modell, das auch die Basis von ChatGPT bildet.
image
FHNW-Professor Oliver Bendel
Vallader sei eine Schriftsprache, von der es digitale Texte in ausreichender Anzahl für das Projekt gebe, sagt Bendel: "Wir konnten davon ausgehen, dass sie auch in GPT-4 Eingang gefunden haben. Tatsächlich erwies sich das Sprachmodell als sehr mächtig innerhalb dieses Idioms." Zudem habe man eine Text-to-Speech-Engine für Vallader gefunden, die von der Zürcher Firma Slowsoft entwickelt und gratis zur Verfügung gestellt wurde.
Dalil Jabou konnte GPT-4 aber nicht direkt trainieren. Er hat die bestehende "Intelligenz" mit einer Wissensdatenbank ergänzt, die mit Sätzen aus Kinderbüchern gefüttert wurde. Diese werden bei bestimmten Eingaben abgerufen, wie in einem klassischen Chatbot. Zudem wurde der Vallader-Bot mit Instruktionen ausgerüstet und an die Text-to-Speech-Engine angebunden.

Ein Feldversuch in Tarasp Fontana

Die bisherigen Tests seien vielversprechend verlaufen, erklärt Bendel, der den Bot Schülern, Studierenden und Interessierten zur Verfügung stellen will. Ein Experte habe die Sprachausgabe bereits begutachtet. In Tarasp Fontana, ganz im Osten des Bündnerlandes, hat Bendel zudem eine Art Feldversuch durchgeführt: Eine Frau von vielleicht 78 Jahren, gerade vom Nordic Walking zurück – so beschreibt Bendel die Versuchsanordnung –, habe die Antworten des Bots ungefragt ins Deutsche übersetzt und sich über die Künstliche Intelligenz und die Aussprache des Bots gefreut.
image
Der Bot wirbt auf Input in Vallader für das Unterengadin.
"Über die FH Graubünden versuchen wir, an weitere Vallader-Sprecher zu kommen. Ich kann ja nicht die ganze Zeit durchs Unterengadin fahren und ältere Damen belästigen", sagt Bendel. Der Generalsekretär von Lia Rumantscha, dem Dachverband der romanischen Sprachvereine, wird den Bot zudem auf Herz und Nieren prüfen.
"Wir würden gerne dabei helfen, gefährdete Sprachen zu fördern und zu erhalten. Wir werden weiter systematisch nach solchen Sprachen suchen", sagt Bendel. "Es ist aber nicht unsere Intention, schon ein fertiges Produkt vorzulegen. Wir entwickeln immer nur Prototypen." Diese könne man frei weiterentwickeln.
Internetuser können den Bot auf einer Website bereits testen. Die Textausgabe läuft flüssig, auch wenn die Überprüfung des Inhalts Vallader-Sprechenden vorbehalten bleibt. Die Sprachausgabe klingt noch etwas abgehackt, dürfte aber durchaus verständlich sein.

Loading

Mehr zum Thema

image

Winterthur erneuert Smart City Strategie

Die 2018 definierte Smart-City-Strategie sei nicht mehr zeitgemäss, befindet der Stadtrat. Neu rücken Innovation, Bedürfnisorientierung und Co-Kreation in den Mittelpunkt.

publiziert am 20.12.2024
image

KI führt zu Boom bei Halbleitern und Rechenzentren

Software mit Künstlicher Intelligenz verlangt mehr Rechenleistung. Analysten erwarten, dass 2025 die Halbleiterindustrie und der RZ-Markt einen Boom erleben.

publiziert am 16.12.2024
image

Weitere 60 Millionen Dollar für Anybotics

Das Zürcher Robotik-Startup will mit dem Geld seine Expansion, insbesondere in die USA, vorantreiben.

publiziert am 13.12.2024
image

Schwyz unterstützt neues CSEM Forschungszentrum in Seewen

Der Kantonsrat hat einen Kredit von 11 Millionen Franken gesprochen. Am neuen Zentrum soll auch über KI geforscht werden.

publiziert am 12.12.2024