Google lässt die AIs aufeinander los

Die Google-Tochter DeepMind lässt künstliche Intelligenz gegeneinander antreten. Verhalten sich AIs kooperativ oder aggressiv?

Aggression steigt bei Ressourcen-Mangel

Auf der Pirsch wird kooperiert

Die AI-Tochter von Google, DeepMind, lässt "AI-Agenten" in zwei Computerspielen gegeneinander antreten, um zu herauszufinden, wie sich diese in verschiedenen Situationen verhalten. Zum einen geht es darum, "soziale Dilemmas" herzustellen und zu sehen, ob die AI sich kooperativ oder aggressiv verhält. Weiter aber könne gezeigt werden, wann und warum Kooperation entsteht und ferner sollen die Konsequenzen von komplexen politischen oder ökonomischen Entscheidungen getestet werden können."Die Frage, wie und unter welchen Umständen egoistische Teilnehmer kooperieren, ist eine der fundamentalsten Fragen der Geisteswissenschaften", schreibt DeepMind in einem Blogeintrag. Die Agenten wurden nicht so programmiert, dass sie die beste Strategie von Start aus kennt, sondern sollte durch Ausprobiereneigene Methoden erlernen. Dies war auch bei der DeepMind-Software der Fall, die vergangenes Jahr erstmals einen menschlichen Spieler im Brettspiel Go geschlagen hat.In einem der beiden Spiele, Gathering, müssen zwei Teilnehmer, Rot und Blau, Äpfel aus einem Stapel sammeln. Je mehr Äpfel gesammelt werden, umso grösser die Belohnung. Es gibt auch die Möglichkeit mit einem Laserstrahl den Gegner kurzfristig einzufrieren. Dafür gibt es aber keine Belohnung.DeepMind liess die AI-Agenten tausende von Spiele gegeneinander spielen. Wenn es noch genug Äpfel hat, verhalten sich die beiden Agenten friedlich und versuchen so viele Apfel wie möglich zu sammeln. Sinkt aber die Zahl der verfügbaren Äpfel, lernen die Agenten, dass es hilfreich ist, den anderen zu stören um mehr Zeit zum sammeln zu haben.Im zweiten Spiel, Wolfpack, sind die Teilnehmer Wölfe, die eine Beute jagen. In der Umgebung gibt es Hindernisse. Sind beide Wölfe in der Nähe des Opfers, wenn einer es fängt, gibt es eine Belohnung für beide Wölfe. Erwischt jedoch ein Wolf die Beute alleine, gibt es das Risiko, dass diese von Plünderern geklaut wird. Auch dieses Spiel wurde trainiert. Je smarter die Software wurde, desto mehr kooperierten die beiden Teilnehmer, schreibt DeepMind.Wie DeepMind schreibt, zeigen diese Beispiele, dass AI-Software durch bestärkendes Lernen (reinforcement learning) je nach Situation das Verhalten ändert und entweder aggressiver oder kooperativer wird. Anwendungsbeispiele sieht DeepMind in anderen Multiangentensystemen, darunter auch Verkehrssystemen. Bei der Verkehrsregelung soll ja die optimale Situation für jeden Teilnehmer erzielt werden.Aber auch in sehr komplexen Fällen, wie die globale Wirtschaft, wo die anhaltende Kooperation wichtig ist, könnte AI eingesetzt werden. Man könne etwa die Auswirkungen von neuen Gesetzen oder Handelsabkommen testen.DeepMind hat ein detailliertes Paper zum Thema veröffentlicht. (kjo)