Belangrijke doorbraak: computer verslaat mens in complex bordspel Go

Voor het eerst heeft een computer een van de beste spelers van het millennia oude Chinese bordspel Go verslagen. Een doorbraak in de wereld van de kunstmatige intelligentie waar zelfs Marvin Minsky, de zondag op 88-jarige leeftijd overleden godfather van de artificiële intelligentie, enorm van zou hebben opgekeken. Computerprogramma AlphaGo won vijf partijtjes op rij van Europees kampioen Fan Hui.

AlphaGo is ontwikkeld door een groep onderzoekers van het bedrijf Google DeepMind, onder leiding van David Silver en Demis Hassabis. Zij publiceren de opmerkelijke prestatie van AlphaGo deze week in het wetenschappelijke tijdschrift Nature. Uit het artikel Mastering the game of Go with deep neural networks and tree search, blijkt AlphaGo zijn succes vooral te danken aan de toenemende rekenkracht van computers, de mogelijkheden van big data (leren van eerdere partijen) en ontwikkelingen op het gebied van deep learning (leren via patroonherkenning en instinct).

Toch komt de overwinning van AlphaGo op drievoudig Europees kampioen Fan Hui voor velen als een enorme verrassing. 'Experts dachten dat het zeker nog tien jaar zou duren voordat een computer zou kunnen winnen van een van de beste professionele Go-spelers', aldus Hassabis in Nature. In 1994 wist het computerprogramma Chinook de mens al te verslaan met dammen. Twee jaar later werd DeepBlue wereldnieuws door toenmalig wereldkampioen schaken Garry Kasparov te verslaan. Vorig jaar mocht computerprogramma Cepheus zich de beste pokeraar ter wereld noemen.

Maar Go, dat algemeen wordt gezien als het meest complexe spel ter wereld, was volgens Hassabis 'de heilige graal van de kunstmatige intelligentie'. Go wordt gespeeld op een bord met 361 kruispunten. De bedoeling van het spel is dat beide spelers met hun stenen (de ene wit, de andere zwart) zoveel mogelijk kruispunten op het bord veroveren. Stenen van de tegenstander kunnen geslagen worden door ze te omsingelen. Door ketens te maken, kan een speler stenen op het bord vastleggen.

Hoewel de regels van Go dus niet bijzonder ingewikkeld zijn, is het spelverloop dat zeker wel: zijn er bij schaken bij elke zet al zo'n 20 verschillende mogelijkheden bij Go zijn dat er zeker 200. Topspelers vertrouwen dan ook vooral op instinct. En dat is een menselijk kenmerk dat tot nu toe maar nauwelijks aan computerprogramma's kon worden aangeleerd.

AlphaGo is het dus wel gelukt. De onderzoekers van Google DeepMind lieten het computerprogramma eerst een analyse maken van 30 miljoen zetten van Go-partijtjes tussen professionele spelers. Hierdoor leerde AlphaGo welke patronen vaker terugkeerden en welke goed uitpakten en welke slecht. Het leerde dus intuïtief te zijn.

Vervolgens speelde AlphaGo vele varianten van het bordspel Go tegen zichzelf en leerde de computer uit zijn fouten. 'Hierdoor kon het programma, en dat was de derde stap in het leerproces, ook op lange termijn leren voorspellen', aldus onderzoeker Hassabis.

Volgens experts gaat de overwinning van AlphaGo veel verder dan een partijtje Go. 'Dit is een enorme doorbraak voor kunstmatige intelligentie, met vergaande gevolgen', aldus Cambridge-professor Zoubin Ghahramani tegenover de BBC. 'Het technische idee dat hieraan ten grondslag ligt is het idee van versterkt leren, waarbij computers zelf leren hun gedrag te verbeteren om bepaalde doelen te bereiken. Dat kan gebruikt worden bij problemen rond besluitvorming over klimaat, maar het zal bijvoorbeeld ook artsen kunnen helpen om een behandeling te plannen.'

Bij Google zijn ze vooralsnog blij dat ze concurrenten als Facebook en Microsoft, die ook al een tijdje bezig zijn met het ontwikkelen van een computerprogramma dat een professionele Go-speler zou moeten kunnen verslaan, hebben verslagen. Eerder deze week onthulde Facebook-oprichter Mark Zuckerberg trots dat zijn onderzoekers op het punt staan om een computerprogramma af te leveren die de beste Go-spelers ter wereld de baas kan zijn.

Pionier op het gebied van kunstmatige intelligentie

Een van zijn eerste uitvindingen wordt wel gezien als de meest nutteloze machine ooit bedacht. In 1952 lanceerde Marvin Minsky een houten doosje met daarop een aan- en uitknop. Als de knop aan werd ingedrukt kwam er een arm uit het doosje die de knop weer uit drukte. Lees het postuum Marvin Minsky (1927-2016) door Volkskrant-verslaggever Peter de Waard hier

Wedstrijd tegen de wereldkampioen

Het volgende doel van AlphaGo is een partijtje tegen Go-wereldkampioen Lee Se-dol. De wedstrijd tegen de Zuid-Koreaan staat voor komende maart op het programma.

Lee Se-dol heeft al gezegd die partij wel te zien zitten: 'Ik hoor dat AlphaGo verrassend goed is en sterk wordt, maar ik heb vertrouwen dat ik in ieder geval deze keer kan winnen. Ongeacht de uitkomst zal het een belangrijke gebeurtenis in de geschiedenis zijn.'

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden