Deepmind macht seine KI-Wasserzeichen-Technologie Open Source

28. Oktober 2024 um 08:44
image
Echt oder nicht? Illustration: Erstellt durch inside-it.ch mit Midjourney

Google Deepmind hat das Tool SynthID zur Identifizierung von KI-generiertem Text entwickelt und stellt es als Open Source zur Verfügung.

Hinter der von Deepmind entwickelten Technologie SythID steckt eine Familie an Wasserzeichen-Tools für KI-generierte Inhalte. Das Unternehmen hat im vergangenen Jahr ein Wasserzeichen für KI-generierte Bilder vorgestellt und mittlerweile auch eines für generierte Videos eingeführt.
SynthID wird von Google Deepmind in der Gemini-App und den Online-Chatbots eingesetzt. Jetzt hat es das Unternehmen auf Hugging Face quelloffen publiziert. Andere KI-Entwickler sollen die Technologie nutzen können und zur Weiterentwicklung beitragen.
Wie Deepmind erklärt, füge SynthID ein unsichtbares Wasserzeichen direkt in einen Text ein, wenn dieser von einem KI-Modell erzeugt wird. Das Tool könne die Markierungen einerseits erstellen, andererseits aber auch erkennen.

Veränderte Wahrscheinlichkeitsbewertungen

Google Deepmind hat in einem Artikel in 'Nature' detailliertere Informationen zur Technologie publiziert. Im Prinzip macht sich das Tool die Verwendung von Token in einem generierten Text zunutze: Ein LLM generiert Text Token für Token, wobei ein Token ein Zeichen, ein Wort oder ein ganzer Satz sein kann.
Einen Satz wie "Meine liebsten tropischen Früchte sind…", kann eine LLM mit "Mango", "Papaya" oder "Litschi" vervollständigen, schreibt Deepmind. Jedem Token werde eine Wahrscheinlichkeitsbewertung zugewiesen. SynthID könne die Wahrscheinlichkeitsbewertung jedes vorhergesagten Tokens anpassen, ohne die Ausgabe zu verändern.
Dieser Vorgang werde im gesamten generierten Text wiederholt, sodass ein einzelner Satz mehrere durch SynthID angepasste Wahrscheinlichkeitswerte enthalten kann. Das Bewertungsmuster in Kombination mit den angepassten Wahrscheinlichkeitsbewertungen wird als Wasserzeichen betrachtet.

Wasserzeichen können umgangen werden

Deepmind schreibt, dass das System Qualität, Genauigkeit, Kreativität oder Geschwindigkeit des Outputs nicht beeinflusse. Die Erkennung funktioniere bereits ab Texten, die drei Sätze lang sind.
SynthID sei aber kein Allheilmittel zur Identifizierung von KI-generierten Inhalten, betont Deepmind. So habe das System Problemen mit kurzen Texten oder umgeschriebenen und übersetzten Inhalten. Auch OpenAI erforscht Methoden, um KI-Texte mit Wasserzeichen zu versehen, hat aber bislang auf eine Veröffentlichung verzichtet – unter anderem aus technischen Gründen.

Loading

Mehr zum Thema

image

Europäer wollen eigenes OpeneuroLLM entwickeln

Eigene europäische KI-Modelle sollen die EU-Gesetze respektieren und sich für Firmen und Behörden adaptieren lassen. Ihre Mehrsprachigkeit spiegelt die kulturellen Eigenheiten wider.

publiziert am 4.2.2025
image

UBS-IT sieht sich bei CS-Integration auf Kurs

Bis Ende 2026 will die IT der Grossbank alle Applikationen und Server der übernommenen Credit Suisse abgeschaltet haben. Bei der Datenmigration gibt es noch viel zu tun.

publiziert am 4.2.2025
image

KI schützt Inselspital nicht vor Fehldiagnosen

Die Forschenden des Inselspitals sind von der hauseigenen Künstlichen Intelligenz enttäuscht. "Isabel Pro" liefert keine Garantie gegen Fehldiagnosen.

publiziert am 3.2.2025
image

Servicenow legt zu und partnert mit Software­one

Das US-amerikanische Cloud-Unternehmen hat sein Geschäftsjahr mit einem zweistelligen Umsatzplus beendet. Nun soll eine Partnerschaft mit Softwareone mehr Wachstum bringen.

publiziert am 31.1.2025