Tarasp Fontana im Unterengadin. Foto: Daniel Schwen unter Lizenz CC BY-SA 4.0
Ein Bot soll helfen, das noch von 7000 Personen gesprochene Idiom Vallader zu fördern und zu bewahren. Der Assistent wurde an der FHNW entwickelt und bereits in Tarasp Fontana getestet.
Die Sprachdominanz in der Schweiz ist deutlich: Über 60% der Bevölkerung spricht hauptsächlich Deutsch, Rätoromanisch hingegen geben gerade mal 0,5% als Hauptsprache an. Rumantsch Grischun hat in der Schweiz aber den Status einer Landessprache. Mit der 1982 geschaffenen Amtssprache kann man also mit den Behörden kommunizieren.
Die knapp 41'000 rätoromanisch sprechenden Einwohnerinnen und Einwohner der Schweiz pflegen aber lokale Idiome mit eigener Grammatik und Wörterbüchern. Tief im Osten im Unterengadin etwa wird von rund 7000 Personen Vallader gesprochen – von Dorf zu Dorf wiederum mit unterschiedlichem Dialekt. Das Idiom sei gefährdet, sagt Oliver Bendel. Der Professor an der Fachhochschule Nordwestschweiz (FHNW) hat einen Chatbot publiziert, der helfen soll, die Sprachgemeinschaft zu unterstützen und Vallader zu bewahren.
GPT-4 kombiniert mit einer Datenbank
Der Entwickler Dalil Jabou hat unter der Aufsicht von Bendel die Software geschrieben, damit diese Deutsch, Englisch und Rätoromanisch als Texteingabe verarbeiten kann und dann Vallader in geschriebener und gesprochener Sprache ausgibt – quasi ein halber Sprachassistent, wie Bendel erklärt. Möglich machte dies GPT-4, das Modell, das auch die Basis von ChatGPT bildet.
FHNW-Professor Oliver Bendel
Vallader sei eine Schriftsprache, von der es digitale Texte in ausreichender Anzahl für das Projekt gebe, sagt Bendel: "Wir konnten davon ausgehen, dass sie auch in GPT-4 Eingang gefunden haben. Tatsächlich erwies sich das Sprachmodell als sehr mächtig innerhalb dieses Idioms." Zudem habe man eine Text-to-Speech-Engine für Vallader gefunden, die von der Zürcher Firma Slowsoft entwickelt und gratis zur Verfügung gestellt wurde.
Dalil Jabou konnte GPT-4 aber nicht direkt trainieren. Er hat die bestehende "Intelligenz" mit einer Wissensdatenbank ergänzt, die mit Sätzen aus Kinderbüchern gefüttert wurde. Diese werden bei bestimmten Eingaben abgerufen, wie in einem klassischen Chatbot. Zudem wurde der Vallader-Bot mit Instruktionen ausgerüstet und an die Text-to-Speech-Engine angebunden.
Ein Feldversuch in Tarasp Fontana
Die bisherigen Tests seien vielversprechend verlaufen, erklärt Bendel, der den Bot Schülern, Studierenden und Interessierten zur Verfügung stellen will. Ein Experte habe die Sprachausgabe bereits begutachtet. In Tarasp Fontana, ganz im Osten des Bündnerlandes, hat Bendel zudem eine Art Feldversuch durchgeführt: Eine Frau von vielleicht 78 Jahren, gerade vom Nordic Walking zurück – so beschreibt Bendel die Versuchsanordnung –, habe die Antworten des Bots ungefragt ins Deutsche übersetzt und sich über die Künstliche Intelligenz und die Aussprache des Bots gefreut.
Der Bot wirbt auf Input in Vallader für das Unterengadin.
"Über die FH Graubünden versuchen wir, an weitere Vallader-Sprecher zu kommen. Ich kann ja nicht die ganze Zeit durchs Unterengadin fahren und ältere Damen belästigen", sagt Bendel. Der Generalsekretär von Lia Rumantscha, dem Dachverband der romanischen Sprachvereine, wird den Bot zudem auf Herz und Nieren prüfen.
"Wir würden gerne dabei helfen, gefährdete Sprachen zu fördern und zu erhalten. Wir werden weiter systematisch nach solchen Sprachen suchen", sagt Bendel. "Es ist aber nicht unsere Intention, schon ein fertiges Produkt vorzulegen. Wir entwickeln immer nur Prototypen." Diese könne man frei weiterentwickeln.
Internetuser können den Bot auf einer Website bereits testen. Die Textausgabe läuft flüssig, auch wenn die Überprüfung des Inhalts Vallader-Sprechenden vorbehalten bleibt. Die Sprachausgabe klingt noch etwas abgehackt, dürfte aber durchaus verständlich sein.