AlphaZero

Was ist AlphaZero?

AlphaZero ist ein selbstlernendes Computerprogramm von Google DeepMind, welches die Brettspiele Go, Schach und Shogi mithilfe seines Algorithmus erlernt. Dafür kombiniert es maschinelles Lernen mit neuronalen Netzen. Zum Erlernen eines der genannten Brettspiele, benötigt die Künstliche Intelligenz nur die Spielregeln, Spielbedingungen und intensives Spielen gegen sich selbst. Das Anlernen durch den Menschen ist nicht nötig.

AlphaZero basiert auf dem Ansatz von AlphaGo Zero, welches auch von DeepMind entwickelt wurde.

Wie leistungsfähig ist das Programm?

Da AlphaZero selbst lernt, steigert sich dessen Leistung mit jedem ausgetragenen Spiel. Es kennt nur die jeweiligen Spielregeln und beginnt mit Zufallszügen gegen sich selbst zu spielen. Es bewertet seine Züge nach dem Ergebnis und lernt so, welche Strategien bestmöglich funktionieren.

Bereits nach 4 Stunden war AlphaZero in der Lage, Schach auf übermenschlichen Niveau zu spielen und hat die Spielstärke von Schach-Weltmeister Magnus Carlsen mit einer Elo-Zahl von über 2800 übertroffen. Nach 9 Stunden Training hat es auch das bis dahin beste Schachprogramm Stockfish 8 mit einer kalkulierten Elo-Zahl von 3300 übertroffen.

Nach 34 Stunden hat AlphaZero die Brettspiele Schach, Shogi und Go gemeistert und alle bis dahin führenden Programme herausgefordert. Neben den Sieg gegen Stockfisch 8 im Schach, hat es Elmo im Shogi und AlphaGo im Go besiegt.

Dabei ist aber zu beachten, dass für die immense Zahl an Spielen gegen sich selbst, sehr viel Rechenleistung nötig ist. Um dies zu ermöglichen, wurde eine große Menge an TPUs (Tensor-Prozessoren, um Anwendungen des maschinellen Lernens zu beschleunigen) von Google genutzt. Damit konnte AlphaZero ungefähr 44 Millionen Schachspiele in 9 Stunden, 24 Millionen Shogi-Spiele in 12 Stunden und 21 Millionen Go-Spiele in 34 Stunden durchführen, wodurch sich der extrem rasante Lernerfolg von AlphaZero relativiert.

Wichtige Partien

AlphaZero und Stockfish

Stockfish ist ein Schachprogramm, welches, im Gegensatz zu AlphaZero, vom Menschen trainiert wurde und als Open Source kostenlos zur Verfügung steht. Der Algorithmus von Stockfish nutzt ein riesiges Repertoire aus Spielzügen, welche es durch das Spielen gegen menschliche Spieler gelernt hat. AlphaZero fehlt dieser menschliche Einfluss, wodurch die Spielweise als unkonventionell gilt.

2017 war Stockfish 8 das beste Schachprogramm und wurde von AlphaZero deutlich geschlagen. Damit sollte bewiesen werden, dass ein selbstlernender Algorithmus einem durch Menschen trainierten Algorithmus überlegen ist.

2021 ist Stockfish 14 (die neueste Version) wieder die Nummer 1 unter den Schachprogrammen, was unter anderem durch die Kooperation mit Leela Chess Zero und die Nutzung von neuronalen Netzen möglich wurde.

AlphaZero und Leela Chess Zero

Leela Chess Zero (kurz Lc0) ist ein Schachprogramm, welches kostenlos als Open Source genutzt werden kann, genau wie Stockfish. In seiner Funktionsweise wurde es aber AlphaZero nachempfunden. Leela Chess Zero basiert auf Leela Zero Go, welches wiederum Alpha Go Zero als Vorbild hat. Dementsprechend nutzt Lc0 seine Künstliche Intelligenz kombiniert mit maschinellen Lernen und neuronalen Netzen, um Schach zu erlernen. Eine der Hauptzwecke für die Entwicklung von Leela Chess Zero ist nämlich, die Methodik von AlphaZero zu bestätigen.

Es gibt kein offizielles Match von AlphaZero gegen Leela Chess Zero. Dafür tritt Lc0 regelmäßig gegen Stockfish an und ist mittlerweile auf ähnlichen Niveau. 2021 war Lc0 in der Rangliste der besten Schachprogramme auf Platz 2, hinter Stockfish 14.

Data Navigator Newsletter