KI bringt sich selbst das Go-Spiel bei

19. Oktober 2017, 07:00
  • innovation
image

Erstmals lernt eine künstliche Intelligenz ein komplexes Spiel ohne menschliches Zutun. Die neue AlphaGo-Version schlägt nicht nur Menschen, sondern auch ihren Vorgänger – vernichtend.

Erstmals lernt eine künstliche Intelligenz ein komplexes Spiel ohne menschliches Zutun. Die neue AlphaGo-Version schlägt nicht nur Menschen, sondern auch ihren Vorgänger – vernichtend.
Das Aufsehen war gross als die Google-Software AlphaGo 2016 den Spitzenspieler Lee Sedol im Brettspiel Go besiegte. Kürzlich hat AlphaGo auch den vermutlich aktuell weltbesten menschlichen Go-Spieler Ke Jie besiegt. Nun wurde aber AlphaGo selbst vom eigenen Nachfolger "AlphaGo Zero" geschlagen. Und zwar mit dem brutalen Resultat von 100 zu 0.
Das besondere an AlphaGo Zero ist aber nicht, dass die neue KI stärker ist als die Vorgänger-Software. Das System, und dafür steht der Zusatz Zero, hat das nämlich ohne menschliches Zutun ganz alleine gelernt.
Das neue System stammt wie der Vorgänger von der britischen Firma DeepMind, die vor mehr als drei Jahren vom US-Konzern Google übernommen wurde.
Während AlphaGo aber noch über Monate hinweg mit Millionen Zügen von menschlichen Top-Spielern gefüttert und trainiert wurde, gingen die Wissenschaftler um David Silver von DeepMind in London nun andere Wege. Von den Ergebnissen berichten sie im Fachblatt 'Nature'.
Lernen ohne Anschauungsmaterial
Im Zentrum stand der Gedanke, ein System zu bauen, welches das Spiel ohne Anschauungsmaterial von der Pike auf selbst erlernt und auf sich alleine gestellt weiterentwickelt – also "komplett ohne menschliche Intervention funktioniert", erklärte Silver.
Die Fähigkeit ein System dazu zu bringen, etwas annähernd von null auf zu erlernen, sei vor allem dann wichtig, wenn es darum geht, eine Form von KI zu entwickeln, die sich selbstständig auf für sie neue Aufgaben jeglicher Art einstellt. Am Ende strebe man die Entwicklung eines Algorithmus an, der potenziell auf jedes Problem angesetzt werden kann, so der Forscher.
Das neue System begann mit nur minimaler Startinformation über die Regeln und Beschaffenheit des Spiels gegen sich selbst zu spielen. Für gewonnene Spiele wurde es durch ein Punktesystem "belohnt". Dadurch "lernte" AlphaGo Zero mit jedem Spiel dazu.
Nach fast fünf Millionen Partien gegen sich selbst – was allerdings nur wenige Tage in Anspruch nahm –schlug das Programm bereits alle seine Vorgänger. Dafür brauchte es zudem noch weit weniger Rechenressourcen als AlphaGo, heisst es seitens DeepMind.
Nicht nur habe der Algorithmus sozusagen all das in kurzer Zeit herausgefunden, was Menschen in tausenden Jahren über das Spiel Go gelernt haben, er habe auch völlig neue Herangehensweisen entwickelt.
Nun scheinen die Meinungen in der KI-Szene darüber, wie grundlegend dieser Erfolg ist, auseinander zu gehen. Marcus Liwicki von der Technische Universität Kaiserslautern meinte beispielsweise, das DeepMind-Team habe "selbst ja keine fundamentalen algorithmischen Neuerungen vorstellt, sondern hauptsächlich existierende Verfahren clever kombiniert."
Ausserdem sei die Anwendbarkeit des Ansatzes in anderen Bereichen wohl eher eingeschränkt. Bei einer Go-Partie sei Erfolg oder Misserfolg klar definiert. "Das ist in vielen praktischen Problemen jedoch nicht der Fall", so Liwicki. (hjm/sda)

Loading

Mehr zum Thema

image

100 Millionen Dollar für zwei Schweizer Krypto-Startups

Zwei Firmen mit offiziellem Sitz in Zug konnten je 50 Millionen sammeln. Eine verspricht "grüne" Blockchain-Infrastruktur, die andere umfassende Möglichkeiten für Krypto-Investments.

publiziert am 23.9.2022
image

Drohnenschwarm erledigt Bauarbeiten und Reparaturen

In Zukunft sollen Drohnen wie Bienen zusammenarbeiten können, um Bauten zu errichten. Wie ihre tierischen Vorbilder würden sich die Fluggeräte die Arbeit teilen.

publiziert am 22.9.2022
image

Zühlke ist neuer Partner des LowCodeLabs

Zühlke und das Lab der OST machen gemeinsame Sache: Im Bereich Low Code gehen die beiden eine strategische Partnerschaft ein, um Lehre, Forschung und Wirtschaft zu verknüpfen.

publiziert am 20.9.2022
image

Proof of Stake: Ethereum schliesst den Merge ab

Die zweitgrösste Kryptowährung will dank dem neuen Konsensverfahren bis zu 99,95% des Stromverbrauchs einsparen. Nicht alle sind über die Neuerung erfreut.

publiziert am 15.9.2022