"Das schmutzige Geheimnis der AI"

IBM trainierte AI mit Flickr-Bildern – ohne User zu fragen.
 
Um Algorithmen und AI-Systeme zu trainieren, braucht es eine grosse Menge an Daten. Aber woher sollen diese stammen? Um einen Algorithmus für die Gesichtserkennung zu trainieren, habe IBM fast eine Million Fotos von Flickr genutzt und die Bilder mit externen Forschern geteilt, berichtet 'NBC News'. Die fotografierten Personen hätten nicht eingewilligt, dass ihre Bilder zur Entwicklung von Gesichtserkennungssystemen verwendet werden. Und sie hätten bestimmt nicht daran gedacht, dass AI-Systeme letztendlich dazu dienen könnten, sie zu erkennen oder gar zu überwachen.
 
"Das ist das schmutzige kleine Geheimnis der AI-Trainingssets. Forscher schnappen sich einfach alle Bilder, die in der freien Wildbahn verfügbar sind", sagte Jason Schultz, Professor an der NYU School of Law.
 
Dem 'NBC'-Bericht zufolge hat IBM im Januar eine Sammlung von fast einer Million Fotos freigegeben, die zur Beschreibung der Person codiert gewesen seien. Der Datensatz sei dazu bestimmt, akademischen Forschern zu helfen, die Gesichtserkennungstechnologie "fairer" zu gestalten. Nicht nur IBM nutze auf diese Weise öffentlich zugängliche Fotos im Internet. Dutzende anderer Forschungseinrichtungen hätten so Fotos für die Schulung ihrer Gesichtserkennungssystemen gesammelt.
 
Einige Experten und Aktivisten argumentieren, dass dies nicht nur eine Verletzung der Privatsphäre von Millionen von Menschen sei. Es gebe auch die Befürchtung, dass dies auch von Strafverfolgungsbehörden genutzt werden könnte, um gewisse Menschengruppen unverhältnismässig stark zu überwachen, schreibt die US-Zeitung. Im konkreten Fall ging es um dunkelhäutige Personen. Die IBM-Software sei schlechter darin gewesen, dunkelhäutige Frauen genau zu identifizieren im Vergleich zu hellhäutigen Männern.
 
Ein weiteres Problem sei die schwammige Abgrenzung von Business und Forschung. Bei Unternehmen wie IBM oder auch Facebook sei diese Grenze durchaus verschwommen, denn die Unternehmen investieren zwar intensiv in Forschung, aber damit schaffen sie geistiges Eigentum und somit auch Umsatz. "Selbst wenn Algorithmen von akademischen Forschern unter Verwendung nichtkommerzieller Datensätze entwickelt werden, werden diese Algorithmen oft später von Unternehmen zu kommerziellen Zwecken verwendet", so Brian Brackeen, ehemaliger CEO des Gesichtserkennungsunternehmens Kairos.
 
Während einige von 'NBC' befragte Fotografen der IBM-Aktion durchaus kritisch gegenüberstehen, freuen sich andere wiederum, dass ihre Bilder für die Weiterentwicklung von Algorithmen verwendet wird. "Wenn die Bilder von Gesichtern, die ich aufgenommen habe, dabei helfen, AI zu verbessern, Fehlerkennungen zu reduzieren und letztlich die globale Sicherheit zu verbessern, bin ich damit einverstanden", sagte der Schweizer Fotograf Guillaume Boppe zu 'NBC'.
 
Gegenüber 'The Verge' sagte IBM, dass man die Privatsphäre von Einzelpersonen sehr erst nehme und die Datenschutzgrundsätze einhalte. Der Datensatz könne nur von Forschern abgerufen werden und enthalte nur Bilder, die öffentlich zugänglich seien. Ausserdem biete IBM eine Möglichkeit zum Opt-out. Sowohl Fotografen als auch abgelichtete Personen können sich melden, um ihre Bilder nachträglich aus dem Datensatz entfernen zu lassen. (kjo)