KI produziert alternative Fakten

13. Februar 2025 um 15:37

Foto: Michael Dziedzic / Unsplash

Die 'BBC' hat vier KI-Modelle auf ihre Faktentreue hin untersucht. ChatGPT, Copilot, Gemini und Perplexity AI blieben nicht immer bei der Wahrheit.

Die 'BBC' hat schon einmal schlechte Erfahrungen mit Künstlicher Intelligenz gemacht. In einer News-Zusammenfassung produzierte Apple Intelligence auf der Grundlage von 'BBC'-Berichten die Falschmeldung, der Attentäter des Krankenkassen-CEO Brian Thomson hätte sich erschossen. Der britische Sender beschwerte sich bei Apple, die daraufhin die News-Zusammenfassungen abschaltete.

Mittlerweile beschäftigt die 'British Broadcasting Corporation' einen Programme Director for Generative AI. Pete Archer interessierte, ob allenfalls nur Apples KI Schwierigkeiten beim Verarbeiten der 'BBC'-News hat. Der Sender hat seine Inhalte vor dem Zugriff der populären KI-Modelle geschützt. Für einen Test fütterte Archer nun aber ChatGPT, Copilot, Gemini und Perplexity AI mit dem Nachrichtenarchiv der 'BBC'.

Jede zweite KI-Antwort nicht korrekt

Apple ist kein Einzelfall, lautet das Ergebnis des Vergleichstests. Die vier KI-Modelle hatten 100 Fragen zu Nachrichten zu beantworten und sollten dabei möglichst 'BBC'-Quellen nutzen. Die Antworten prüften 'BBC'-Journalisten mit Expertise in den verschiedenen Bereichen dann auf fachliche Richtigkeit, Neutralität und die Übereinstimmung mit den Quellen. Die Resultate sind ernüchternd.

Jede zweite Antwort der KI-Modelle besass mindestens einen Aspekt, der nicht korrekt wiedergegeben wurde. Fast 20% der Antworten mit Bezug zu 'BBC'-Quellen enthielten sachliche Fehler, wie falsche Daten, Tatsachenbehauptungen und Zahlen. Und bei jeder achten KI-Antwort wurden Zitate verwendet, die entweder anders oder gar nicht in der Quelle vorkamen.

Die Antworten von Googles KI-Modell Gemini wiesen die grössten Probleme (34%) bei der Reproduktion von Nachrichteninhalten auf, heisst es in dem 'BBC'-Forschungsbericht (PDF). Auf den Plätzen folgen Microsoft Copilot (27%), Perplexity AI (17%) und ChatGPT (15%). Die häufigsten Probleme der KI-Modelle waren fehlender Kontext und Quellenangaben sowie sachliche Ungenauigkeiten.

Mehr zum Thema

TSMC plant weitere Milliardeninvestitionen

Der weltgrösste Chip-Auftragsfertiger will alleine in den Vereinigten Staaten zehn neue Fabriken bauen und dafür bis zu 265 Milliarden US-Dollar in die Hand nehmen.

AWS Summit bringt Two-Pizza-Teams in die Schweiz

Am 2. September findet mit dem "AWS Summit Zürich" einer der grössten IT-Anlässe der Schweiz statt. Über 80 Sessions erwarten das Publikum.

Security-Fachleute misstrauen KI – mehr oder weniger

KI kann die Effizienz erhöhen, aber manche fühlen mehr Stress als früher.

KI war schon 2024 gefragte Kompetenz

Bereits vor zwei Jahren waren Fachkräfte mit KI-Kompetenzen auf dem Schweizer Arbeitsmarkt gesucht. Eine Studie der Universität Liechtenstein erlaubt einen Rückblick.