Übersetzungs-Software: Schweizer Fortschritt ruft Google auf den Plan

3. April 2017, 15:00
  • innovation
  • google
image

Programme wie "Google Translate" verwenden Statistik, um die wahrscheinlichste Übersetzung von Wortgruppen in Sätzen zu liefern.

Programme wie "Google Translate" verwenden Statistik, um die wahrscheinlichste Übersetzung von Wortgruppen in Sätzen zu liefern. Hinter menschlichen Übersetzern liegen die Maschinen jedoch noch meilenweit zurück.
Einer der Gründe: Die Algorithmen schauen dabei nicht über die Grenzen eines Satzes hinaus. Dadurch haben sie etwa Mühe mit Pronomen, wie "sie" oder "diese", da das, worauf sie sich beziehen, in einem anderen Satz steht.
Forschende um Andrei Popescu-Belis vom Forschungsinstitut Idiap in Martigny im Wallis wollen das im Rahmen eines vom Schweizerischen Nationalfonds (SNF) unterstützten Projekts ändern, indem sie den Algorithmus auch angrenzende Sätze analysieren lassen.
Auch wenn die entwickelten Techniken noch nicht für die breite Anwendung ausgereift sind, haben sie bereits das Interesse grosser Akteure geweckt. "Drei an diesem Projekt beteiligte Nachwuchsforschende arbeiten nun bei Google in Zürich zu diesem Thema. Das zeigt, wie gross das Interesse an unserem Ansatz ist", wird Popescu-Belis in einer Mitteilung des SNF zitiert.
Fehlerrate bisher bei 50 Prozent
Ein Beispiel, wie das "Satz für Satz" Vorgehen von Übersetzungstools Probleme mit Pronomen verursacht, gibt der SNF in der Mitteilung: "Meine Tante hat eine tolle Limousine gekauft. Sie ist aber nicht so schön." Google Translate übersetzt dies so ins Englische: "My aunt has bought a great sedan. But she is not so beautiful." Der englischsprachige Leser liest also, dass die Tante nicht so schön sei, weil "sie" in Zusammenhang mit "schön" öfter mit "she" übersetzt wird als mit "it".
Solche Probleme bestehen insbesondere bei Übersetzungen zwischen Französisch und Englisch, sowie Englisch und Spanisch. Programme wie Google Translate irren sich beim Übersetzen von Pronomen bei diesen Sprachpaaren in rund der Hälfte der Fälle.
Verbesserung durch machine learning
Das von Popescu-Belis' Team gemeinsam mit Kollegen von den Universitäten Genf, Zürich und Utrecht entwickelte Tool senkt diese Fehlerrate auf 30 Prozent, wie der SNF schreibt.
"Im Prinzip geben wir dem System an, wie viele der voranstehenden Sätze es in welcher Weise analysieren muss. Dann testen wir es unter realen Bedingungen", sagt Popescu-Belis gemäss der Mitteilung.
Das Forschungsteam sieht in der Lösung des Pronomen-Problems indes nur den Anfang. Mit der gleichen Idee, Maschinen mit mehr Textverständnis übersetzen zu lassen, wollen sie auch Aspekte wie die korrekte Abfolge der Zeiten oder die zum Kontext passende Terminologie verbessern. (sda/ts)

Loading

Mehr zum Thema

image

Google will ChatGPT-Konkurrenz öffentlich zugänglich machen

OpenAI hat mit Microsoft den Kampf um die Zukunft des Internets eröffnet, nun zieht Google nach. Das bedeutet ein Umdenken im Suchmaschinenkonzern.

publiziert am 3.2.2023
image

So arbeiten Googles interne Hacker

Hoodies, Plasmalampen, digitale Brandstiftung. Daniel Fabian, Leiter von Googles Team Red, zeigt Praktiken seiner Hacker-Gruppe.

publiziert am 2.2.2023
image

ChatGPT: OpenAI entwickelt KI, um eigene KI zu entlarven

Die Firma hat ein neues Tool auf den Markt gebracht, das erkennen soll, ob ein Text von einem Menschen oder einer KI geschrieben wurde.

publiziert am 1.2.2023
image

Hunderte Software-Entwickler sollen ChatGPT trainieren

Wird einfaches Codeschreiben bald obsolet? OpenAI und Microsoft möchten ChatGPT beibringen, beim Schreiben von Code wie ein Mensch vorzugehen.

publiziert am 31.1.2023