Spring naar inhoud

2017.12.08: Wereldkampioen binnen vier uur

Deze week vond er een schaakmatch plaats die je makkelijk gemist kunt hebben. De leider in schaaksoftware, Stockfish 8, werd uitgedaagd door de ‘new kid on the block’ AlphaZero van Google. Nu heeft Stockfish een ELO rating van 3400+ en dus is het geen kleine jongen! Wat voor een geweldenaar moet AlphaZero dan wel niet zijn om de handschoen op te nemen?

Nou, AlphaZero is een beginner. Wat de programmeurs hebben gedaan is dit. Ze hebben AlphaZero uitgelegd wat alle spelregels zijn van het schaakspel. Daarna hebben ze het programma vier uur lang tegen zichzelf laten spelen. Er kwamen dus geen gigantische databases van partijen, openingstheorie of eindspelkennis aan te pas. Alleen maar spelen. Vier uur lang.

Toen kwam de match. Die ging over 100 partijen. AlphaZero won tamelijk overtuigend: +28 =72 -0. Van de 28 partijen die AlphaZero won, waren er 25 met wit en drie met zwart. Geen enkele partij ging verloren!

Hoe is dit mogelijk? Aan de basis van het succes van AlphaZero ligt “machine learning”; er komt geen mens meer aan te pas om de computer te leren hoe hij goed kan schaken, de software leert van ontelbaar veel partijen die hij (ongetwijfeld in een razend tempo) tegen zichzelf speelt. En het is niet alleen rekenkracht! De ontwikkelaars beweren dat AlphaZero ‘slechts’ 80.000 stellingen per seconde bekijkt, waar Stockfish 8 er in dezelfde tijd 70.000.000 bekijkt! AlphaZero is dus in staat om net als een mens een soort selectie te maken van stellingen waar hij naar moet kijken. Met succes, dat zal duidelijk zijn.

Er is nog iets anders aan de hand. Van de 100 partijen die zijn gespeeld, zijn er inmiddels 10 gepubliceerd. Wat je daarin ziet is dat Stockfish nog als een ’traditionele’ schaakrobot speelt. Stockfish hecht veel waarde aan een materiĆ«le voorsprong. AlphaZero is in staat om bijvoorbeeld een pion te offeren voor een voordeel op de hele lange termijn. AlphaZero kan dus schaken zoals een mens doet, maar dan wel als een ‘supermens’. Zoals GM Peter Heine Nielsen het uitdrukt: “ik heb mij afgevraagd hoe superintelligente buitenaardse wezens zouden schaken als ze op aarde kwamen, maar ik denk dat ik het nu weet.”

De implicaties van deze stap kunnen enorm zijn. Niet alleen voor het schaken, maar in het algemeen voor “machine learning”. Om een voorbeeld te geven uit de geneeskunde. Nu al zijn computers in staat om bij tenminste acht soorten tumoren een betere en snellere diagnose te stellen dan medisch specialisten. Met de zelf-lerende systemen die in ontwikkeling zijn lijkt het alleen maar een kwestie van tijd voordat de diagnosticering van complexe ziekten als tumoren veel sneller en effectiever kan gaan plaatsvinden. Op dit moment lijkt onze fantasie daarover de belangrijkste beperking te zijn.

Dit artikel is een verkorte bewerking van een artikel dat verschenen is op chess.com. Klik hier voor het originele (Engelstalige) artikel. Op YouTube verschijnen de eerste video-analyses, bijvoorbeeld deze van ChessNetwork. Het is zeer indrukwekkend hoe AlphaZero zijn tegenstander een lesje leert.