Hinter der von Deepmind entwickelten Technologie SythID steckt eine Familie an Wasserzeichen-Tools für KI-generierte Inhalte. Das Unternehmen hat im vergangenen Jahr ein Wasserzeichen für KI-generierte Bilder vorgestellt und mittlerweile auch eines für generierte Videos eingeführt.
SynthID wird von Google Deepmind in der Gemini-App und den Online-Chatbots eingesetzt. Jetzt hat es das Unternehmen auf Hugging Face quelloffen publiziert. Andere KI-Entwickler sollen die Technologie nutzen können und zur Weiterentwicklung beitragen.
Wie Deepmind erklärt, füge SynthID ein unsichtbares Wasserzeichen direkt in einen Text ein, wenn dieser von einem KI-Modell erzeugt wird. Das Tool könne die Markierungen einerseits erstellen, andererseits aber auch erkennen.
Veränderte Wahrscheinlichkeitsbewertungen
Google Deepmind hat in einem Artikel in
'Nature' detailliertere Informationen zur Technologie publiziert. Im Prinzip macht sich das Tool die Verwendung von Token in einem generierten Text zunutze: Ein LLM generiert Text Token für Token, wobei ein Token ein Zeichen, ein Wort oder ein ganzer Satz sein kann.
Einen Satz wie "Meine liebsten tropischen Früchte sind…", kann eine LLM mit "Mango", "Papaya" oder "Litschi" vervollständigen, schreibt Deepmind. Jedem Token werde eine Wahrscheinlichkeitsbewertung zugewiesen. SynthID könne die Wahrscheinlichkeitsbewertung jedes vorhergesagten Tokens anpassen, ohne die Ausgabe zu verändern.
Dieser Vorgang werde im gesamten generierten Text wiederholt, sodass ein einzelner Satz mehrere durch SynthID angepasste Wahrscheinlichkeitswerte enthalten kann. Das Bewertungsmuster in Kombination mit den angepassten Wahrscheinlichkeitsbewertungen wird als Wasserzeichen betrachtet.
Wasserzeichen können umgangen werden
Deepmind schreibt, dass das System Qualität, Genauigkeit, Kreativität oder Geschwindigkeit des Outputs nicht beeinflusse. Die Erkennung funktioniere bereits ab Texten, die drei Sätze lang sind.
SynthID sei aber kein Allheilmittel zur Identifizierung von KI-generierten Inhalten, betont Deepmind. So habe das System Problemen mit kurzen Texten oder umgeschriebenen und übersetzten Inhalten.
Auch OpenAI erforscht Methoden, um KI-Texte mit Wasserzeichen zu versehen, hat aber bislang auf eine Veröffentlichung verzichtet – unter anderem aus technischen Gründen.