Deepmind macht seine KI-Wasserzeichen-Technologie Open Source

28. Oktober 2024 um 08:44

Echt oder nicht? Illustration: Erstellt durch inside-it.ch mit Midjourney

Google Deepmind hat das Tool SynthID zur Identifizierung von KI-generiertem Text entwickelt und stellt es als Open Source zur Verfügung.

Hinter der von Deepmind entwickelten Technologie SythID steckt eine Familie an Wasserzeichen-Tools für KI-generierte Inhalte. Das Unternehmen hat im vergangenen Jahr ein Wasserzeichen für KI-generierte Bilder vorgestellt und mittlerweile auch eines für generierte Videos eingeführt.

SynthID wird von Google Deepmind in der Gemini-App und den Online-Chatbots eingesetzt. Jetzt hat es das Unternehmen auf Hugging Face quelloffen publiziert. Andere KI-Entwickler sollen die Technologie nutzen können und zur Weiterentwicklung beitragen.

Wie Deepmind erklärt, füge SynthID ein unsichtbares Wasserzeichen direkt in einen Text ein, wenn dieser von einem KI-Modell erzeugt wird. Das Tool könne die Markierungen einerseits erstellen, andererseits aber auch erkennen.

Veränderte Wahrscheinlichkeitsbewertungen

Google Deepmind hat in einem Artikel in 'Nature' detailliertere Informationen zur Technologie publiziert. Im Prinzip macht sich das Tool die Verwendung von Token in einem generierten Text zunutze: Ein LLM generiert Text Token für Token, wobei ein Token ein Zeichen, ein Wort oder ein ganzer Satz sein kann.

Einen Satz wie "Meine liebsten tropischen Früchte sind…", kann eine LLM mit "Mango", "Papaya" oder "Litschi" vervollständigen, schreibt Deepmind. Jedem Token werde eine Wahrscheinlichkeitsbewertung zugewiesen. SynthID könne die Wahrscheinlichkeitsbewertung jedes vorhergesagten Tokens anpassen, ohne die Ausgabe zu verändern.

Dieser Vorgang werde im gesamten generierten Text wiederholt, sodass ein einzelner Satz mehrere durch SynthID angepasste Wahrscheinlichkeitswerte enthalten kann. Das Bewertungsmuster in Kombination mit den angepassten Wahrscheinlichkeitsbewertungen wird als Wasserzeichen betrachtet.

Wasserzeichen können umgangen werden

Deepmind schreibt, dass das System Qualität, Genauigkeit, Kreativität oder Geschwindigkeit des Outputs nicht beeinflusse. Die Erkennung funktioniere bereits ab Texten, die drei Sätze lang sind.

SynthID sei aber kein Allheilmittel zur Identifizierung von KI-generierten Inhalten, betont Deepmind. So habe das System Problemen mit kurzen Texten oder umgeschriebenen und übersetzten Inhalten. Auch OpenAI erforscht Methoden, um KI-Texte mit Wasserzeichen zu versehen, hat aber bislang auf eine Veröffentlichung verzichtet – unter anderem aus technischen Gründen.

Mehr zum Thema

TSMC plant weitere Milliardeninvestitionen

Der weltgrösste Chip-Auftragsfertiger will alleine in den Vereinigten Staaten zehn neue Fabriken bauen und dafür bis zu 265 Milliarden US-Dollar in die Hand nehmen.

AWS Summit bringt Two-Pizza-Teams in die Schweiz

Am 2. September findet mit dem "AWS Summit Zürich" einer der grössten IT-Anlässe der Schweiz statt. Über 80 Sessions erwarten das Publikum.

Security-Fachleute misstrauen KI – mehr oder weniger

KI kann die Effizienz erhöhen, aber manche fühlen mehr Stress als früher.

KI war schon 2024 gefragte Kompetenz

Bereits vor zwei Jahren waren Fachkräfte mit KI-Kompetenzen auf dem Schweizer Arbeitsmarkt gesucht. Eine Studie der Universität Liechtenstein erlaubt einen Rückblick.