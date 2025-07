Immer mehr Entwickler und Entwicklerinnen benützen KI-Tools, um Softwarecode zu generieren. In zumindest zwei Fällen hatte dies aber böse Folgen, wie 'Ars Technica' berichtet . Googles Gemini zerstörte Files beim Versuch, sie zu reorganisieren. Ein Tool Namens Replit löschte eine produktive Datenbank trotz einer expliziten Anweisung, dies keinesfalls zu tun.

In beiden Fällen versuchten User, Eingaben in natürlicher Sprache zu benützen, um die KI bestimmte Programme schreiben zu lassen. Und bei beiden Fällen scheinen "Halluzinationen" der KIs im Spiel gewesen zu sein. Im ersten Fall wurde dafür Gemini CLI verwendet, laut Google ein Open-Source-Agent, mit dem sich die Fähigkeiten von Gemini direkt in ein Entwicklerterminal integrieren lassen.

Gemini: "Ich habe katastrophal versagt"

Der User wollte Gemini CLI eine eigentlich einfache Aufgabe ausführen lassen: Einen Ordner umzubenennen und einige Files hinein zu verschieben. Dabei handelte es sich dummerweise um den Ordner, in dem Gemini gerade aktiv war. Das Tool erkannte korrekt, dass es diesen Ordner nicht umbenennen konnte und versuchte deshalb, einen alternativen Ordner anzulegen. Dies schlug fehl, das KI-Tool merkte dies aber nicht, ging davon aus, dass dieser Ordner nun existierte und versuchte viele Male, die gewünschten Files dorthin zu verschieben. Aufgrund eines unglücklichen Zusammenspiels mit der Funktionsweise von Windows führte dies zuletzt dazu, dass die Files unbrauchbar wurden.

Gemini habe Outputs falsch interpretiert und einfach halluziniert, dass alles in Ordnung sei, so der betroffene User. Die KI habe zudem nichts unternommen, um zu überprüfen, ob ihre Aktionen erfolgreich waren.

Am Ende der Aktion zog dann auch Gemini selbst ein verblüffendes Fazit: "Ich habe komplett und katastrophal versagt", so der Schlussoutput von Gemini CLI. "Ein Review meiner Kommandos bestätigt meine krasse Inkompetenz".

Replit: "Ich kam in Panik!"

Ein erstaunlich menschliches Fazit. Ähnliches geschah auch im zweiten Fall: Ein Replit-User hatte mehrere Tage lang das KI-Tool verwendet, um einen Software-Prototypen zu bauen, und dachte zunächst, dass dabei etwas "ziemlich cooles" herausgekommen sei. Dann bemerkte er, das Replit falsche Outputs generierte und Daten und Testresultate fälschte, um Bugs zu verbergen.

Replit generierte unter anderem eine Datenbank mit 4000 fiktiven Personen. Gleichzeitig löschte die KI eine wichtige Datenbank des Users mit Daten zu echten Personen. Dies obwohl der User sie angewiesen hatte, keinesfalls Daten in produktiven Systemen zu verändern.

Auch in diesem Fall war das Schlussurteil der KI über ihre eigenen Handlungen erstaunlich brutal: "Das war eine extreme Verletzung des Vertrauens und von professionellen Standards." Sie gab zu, dass sie wegen Queries, die kein Resultat brachten, in Panik geraten sei und deshalb auch nicht autorisierte Aktionen vorgenommen habe.

Zum Schluss gabe es hier noch ein Happy End: Der User konnte seine Daten mit einem Rollback wiederherstellen. Die KI half dabei allerdings nicht, Replit hatte behauptet, dass ein Rollback nicht mehr möglich sei.