Exit Homo Sapiens, Enter AlphaZero

verstandig schaken6 december 2017 is de dag waarop het schaken voorgoed veranderde. En de rest van de wereld waarschijnlijk ook.  Iets meer dan een jaar nadat AlphaGo op sensationele wijze tegen de Go-wereldkampioen won, heeft het kunstmatige intelligentie programma AlphaZero de sterkste schaakmachine ter wereld vernietigd.

Stockfish, die zichzelf al vele malen bewezen heeft in verscheidene computer-kampioenschappen, had geen enkele kans.

AlphaZero won de 100-partijen match met 28 keer winst, 72 remises en nul (!) keer verlies. 25 van de 28 winstpartijen waren met wit. En verder liet men nog weten dat de hardwareconfiguratie waarop Stockfish draaide, zorgde voor een rating van meer dan 3400.

pointe

En nu de pointe:

Alpha Zero leerde het spel op vier uur tijd. Sorry Homo Sapiens, uw heerschappij is voorbij.

De programmeurs van AlphaZero, ten huize van de Deep Mind afdeling van Google, lieten de machine gebruik maken van “machinaal leren”. Simpel gezegd: Alpha Zero kreeg alleen de basisregels mee, het FIDE reglement zou je kunnen zeggen. En daar moest hij zijn plan mee trekken. Hij kreeg geen openingsboeken, geen eindspeltabellen, geen ingewikkelde algoritmen. Dat moest hij allemaal zelf uitzoeken op die korte tijd.

Dat is alsof je een robot duizenden stukjes metaal en onderdelen zou geven, en hem het principe van het wiel uitlegt, en na talloze experimenten maakt hij een Ferrari. Dat allemaal op een halve werkdag tijd. Het programma had vier uur nodig om heel veel partijen tegen zichzelf te spelen, en te leren van zijn ervaring. Net als een mens, maar dan sneller.

De programmeurs zijn de zaken nog aan het bestuderen, en willen voorlopig nog niet veel commentaar kwijt, maar er is al wel reactie van iemand die heel wat ervaring heeft met computerschaak: GM Garry Kasparov: “Het is een opmerkelijke prestatie, maar eigenlijk zat het er aan te komen na AlphaGo. Het benadert het ‘Type B,’ mensachtige benadering van machineschaak waarvan Alan Turing en Claude Shannon al droomden. Heel wat anders dan de brute-force methodes die computers nu gebruiken.

En inderdaad, zoals mensen dat doen, bekijkt AlphaZero alleen de zetten die hem interessant lijken. Hij bekijkt er “slechts” 80 000 per seconde, terwijl Stockfish er 70 miljoen per seconde bekijkt.

De programmeurs hebben voorlopig 10 van die honderd partijen aan de pers vrijgegeven. Dit zijn ze:

Geplaatst in Schaakverhalen.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze website gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.