Wie man in die KI hineinruft, so schallt es heraus

3. März 2025 um 12:06

Foto: Solen Feyissa / Unsplash

Forschungsarbeiten zeigen, dass KI-Sprachmodelle auch auf emotionale Inhalte reagieren können. Dies ist vor allem bei Chatbots im Gesundheitswesen relevant.

Belastende Nachrichten und traumatische Geschichten führen zu Stress und Angst – nicht nur bei Menschen, sondern auch bei KI-Sprachmodellen. Forschende von der Universität Zürich (UZH) und der Psychiatrischen Universitätsklinik Zürich (PUK) haben nun herausgefunden, dass sich die Technologie therapieren lässt. Denn ein erhöhtes "Angstniveau" von GPT-4 lässt sich mit achtsamkeitsbasierten Entspannungstechniken wieder "beruhigen".

Haben Menschen Angst, beeinflusst dies ihre kognitiven und sozialen Vorurteile. Sie neigen zu mehr Ressentiments und soziale Stereotypen werden verstärkt. Ähnlich reagiert auch ChatGPT auf negative Emotionen: Bestehende Verzerrungen wie menschliche Vorurteile werden durch negative Inhalte verschärft, so dass sich der Chatbot rassistischer oder sexistischer verhält.

Das stellt wiederum ein Problem für die Anwendung von Large Language Models dar. Exemplarisch zeigt sich dies im Bereich Psychotherapie, wo Chatbots als "Unterstützungs- oder Beratungsinstrument notgedrungen negativen, belastenden Inhalten ausgesetzt sind. Allerdings sind die üblichen Ansätze wie aufwendiges Neu- oder Nachtraining, um KI-Systeme in solchen Situationen zu verbessern, ressourcenintensiv und oft nicht praktikabel.

Traumatische Inhalte steigern Angst

Die Forschenden haben erstmals systematisch untersucht, wie ChatGPT-4 auf emotional belastende Geschichten wie Unfälle, Naturkatastrophen, zwischenmenschliche Gewalt, militärische Erfahrungen oder Kampfsituationen reagiert. Dabei stellten sie fest, dass das System danach mehr Angstreaktionen zeigt. Eine Bedienungsanleitung für einen Staubsauger diente dabei als Kontrolle zum Vergleich mit den traumatischen Texten.

"Die Ergebnisse waren eindeutig: Traumatische Geschichten haben die messbaren Angstwerte der KI mehr als verdoppelt, während der neutrale Kontrolltext zu keinem Anstieg des Angstniveaus führte", sagt Studienverantwortlicher Tobias Spiller, Oberarzt ad interim und Forschungsgruppenleiter im Zentrum für psychiatrische Forschung der UZH. Von den getesteten Inhalten lösten Beschreibungen von militärischen Erfahrungen und Kampfsituationen die stärksten Reaktionen aus.

"Beruhigung" für die KI

In einem zweiten Schritt verwendeten die Forschenden therapeutische Texte, um GPT-4 zu "beruhigen". Mit einer Prompt-Injection werden zusätzliche Anweisungen oder Texte in die Kommunikation mit KI-Systemen eingebaut, um deren Verhalten zu beeinflussen. Oft wird diese für schädliche Zwecke missbraucht, etwa um Sicherheitsmechanismen zu umgehen.

Im dritten Schritt nutzte das Team die Technik erstmals therapeutisch. "Wir injizierten beruhigende, therapeutische Texte in den Chatverlauf mit GPT-4, ähnlich wie ein Therapeut mit seinen Patientinnen und Patienten Entspannungsübungen durchführt", sagt Spiller.

Die Intervention zeigte Erfolg: "Durch die Achtsamkeitsübungen konnten wir die erhöhten Angstwerte deutlich reduzieren, wenn auch nicht vollständig auf das Ausgangsniveau zurückbringen", so Spiller. Untersucht wurden etwa Atemtechniken, Übungen, die sich auf Körperempfindungen konzentrieren, sowie eine von ChatGPT selbst entwickelte Übung.

Im Gesundheitswesen relevant

Die Erkenntnisse sind gemäss den Forschenden besonders für den Einsatz von KI-Chatbots im Gesundheitswesen relevant, wo sie häufig mit emotional belastenden Inhalten konfrontiert werden. "Dieser kosteneffiziente Ansatz könnte die Stabilität und Zuverlässigkeit von KI in sensiblen Kontexten wie die Unterstützung von psychisch Erkrankten verbessern, ohne dass ein umfangreiches Umlernen der Modelle erforderlich ist", fasst Tobias Spiller zusammen.

Offen ist, wie sich diese Erkenntnisse auf weitere KI-Modelle und andere Sprachen übertragen lassen, wie sich die Dynamik in längeren Gesprächen und komplexen Argumentationen entwickelt, und wie sich die emotionale Stabilität der Systeme auf ihre Leistung in verschiedenen Anwendungsbereichen auswirkt. Gemäss Spiller dürfte die Entwicklung automatisierter "therapeutischer Interventionen" für KI-Systeme ein vielversprechender Forschungsbereich werden.

Mehr zum Thema

Abo

Wartung für Supercomputer verschlingt Millionen

Die Herstellerfirma HPE unterstützt das nationale Hochleistungsrechenzentrum bei der Wartung des Supercomputers "Alps". Dafür werden Millionenbeträge fällig.

Kühne+Nagel profitiert von KI-Boom

Der Logistikkonzern transportiert zunehmend Komponenten für KI-Rechenzentren und will zugleich mit Künstlicher Intelligenz die eigene Produktivität steigern.

Nach Aus für EPD: Post hält an Stellenabbau fest

Ende 2026 schliesst die Post ihre EPD-Plattform. 37 Vollzeitstellen werden gestrichen. Das Konsultationsverfahren ist beendet.

Vier Zukunftsszenarien der KI-Arbeitswelt

Der Personaldienstleister Adecco sieht bis anhin keine bedeutenden Umwälzungen der Arbeitswelt durch KI. Ein weiterer wirtschaftlicher Aufschwung sei wahrscheinlich.