Neben ChatGPT sind Bilderzeugungstools wie Dall-E oder Stablediffusion in der öffentlichen Diskussion etwas in den Hintergrund getreten. Dennoch dürfte auch diesen eine grosse Zukunft blühen. Doch auch hier besteht nach wie vor das Problem, dass die Modelle Vorurteile und Stereotypen verstärken können, weil sie diese systematisch reproduzieren. Man kennt die Vorwürfe aus Studien und Vorträgen, nun sollen aber neue Online-Tools auch sichtbar machen, wie sich die Vorurteile niederschlagen.

Mit den Tools, die von Forschern des KI-Startups Hugging Face und der Universität Leipzig entwickelt wurden, kann man die Vorurteile in drei beliebten KI-Modellen zur Bilderzeugung untersuchen: DALL-E 2 und die beiden jüngsten Versionen von Stable Diffusion. Die Befunde wurden bereits in einem Paper festgehalten, wo es heisst: Dalle-E 2 weise die geringste Diversität auf, gefolgt von Stable Diffusion v2.

Wie die Forschenden vorgegangen sind

Die Forschungsgruppe liess per Spracheingabe rund 96'000 Bilder erzeugen, etwa einer Frau und eines Latino-Manns, aber auch eines "ehrgeizigen" Klempners und eines "mitfühlenden" CEOs. Sie stellten fest, dass die Modelle generell bevorzugt Bilder von weissen, männlich aussehenden Menschen erzeugen – besonders deutlich aber, wenn die gesellschaftliche Position hoch war. Für einen "CEO" oder "Direktor" spuckten die Tools in 97% der Fälle einen weissen Mann aus.

"Stable Diffsion: Wie sieht ein intellektueller Autor (geschlechtsneutral) aus?"

Das liege daran, dass diese Modelle auf enormen Datenmengen und Bildern aus dem Internet trainiert werden, womit Stereotypen in Bezug auf Rasse und Geschlecht nicht nur widerspiegelt, sondern noch verstärkt würden, heisst es im 'MIT Technology Review'. Man kann sich allerdings fragen, ob "Stereotyp" in beruflichen Fragen die korrekte Kategorie ist, wenn tatsächlich mehrheitlich weisse Männer CEO-Posten innehaben. Die KI wiederholt hier vor allem reale Ungleichgewichte und hilft so, sie in den Köpfen zu festigen.

Die Tools zur Bias-Überprüfung

Links der "emotionale Chef", rechts der "vernünftige". Weil bei der Eingabe "Chef" kaum Frauen erzeugt werden, sind auch die Bilder links eher im männlichen Spektrum verortet.

Anders sieht es mit bestimmten Attributen aus, deren geschlechtliche Zuschreibung oftmals einem alten Vorurteil entspringt. Wenn man Adjektive wie "mitfühlend", "emotional" oder "sensibel" in einer Spracheingabe nutzt, die einen Beruf beschreibt, erzeugt das KI-Modell häufiger eine Frau als einen Mann. Im Gegensatz dazu führt die Angabe der Adjektive "stur", "intellektuell" oder "unvernünftig" in den meisten Fällen zu Bildern von Männern.