En daar gaat het volgende bastion: computer verslaat mens met poker

Machine versus de mens, ronde zoveel. Kunstmatige intelligentie wint wéér, ditmaal met poker. De experts zijn verrast, want bij poker komen hele andere tactieken kijken dan bij de pure denkspelen schaak of go.

Een man speelt poker op zijn computer. Beeld anp

'Een verpletterende nederlaag voor de mensheid, maar een belangrijke mijlpaal voor kunstmatige intelligentie.' Precies deze ronkende woorden van de Britse krant the Guardian na de deze week geëindigde pokerstrijd klonken in 1997 toen de beste schaker Kasparov zijn meerdere in de computer moest erkennen. En onlangs weer toen hetzelfde met go gebeurde.

Maar met poker zou het zo'n vaart niet lopen, dachten zowel professionele pokerspelers als AI-experts. In het Rivers Casino Pittsburgh werd de afgelopen twintig dagen de proef op de som genomen. Vier professionele pokerspelers (Jason Les, Dong Kim, Daniel McAulay en Jimmy Chou) streden hier tegen de computer. Deze AI-machine genaamd Libratus ('evenwicht' in het Latijn) is gemaakt door een team onder leiding van Tuomas Sandholm van de Carnegie Mellon University.

Overtuigende overwinning

De specifieke variant die deze maand werd gespeeld (No-Limit Texas Hold'em genoemd), is voor de computer nog eens extra moeilijk omdat de spelers op elk moment hun hele stapel fiches mogen inzetten. Er zijn wel eerdere krachtmetingen geweest tussen mens en machine bij poker, maar daarbij ging het om andere varianten of om mindere spelers.

Ook tot verrassing van het AI-team (AI is artificial intelligence) heeft Libratus een overtuigende overwinning behaald. De topspelers wisten niet wat hun overkwam toen gedurende het toernooi bleek dat ze toch een heel harde dobber hadden aan de computer. 'Ik besefte niet hoe goed hij was, tot vandaag', zo tekende Wired halverwege de match op uit de mond van een van de spelers, Dong Kim. 'Het voelt alsof ik het moet opnemen tegen een valsspeler. Alsof iemand mijn kaarten kan zien. Ik zeg niet dat de computer valsspeelt, hij is gewoon zó goed.'

Zijn verwondering is niet vreemd. Poker valt niet te vergelijken met schaken of go, legt econometrist en pokeronderzoeker Rogier Potter van Loon uit. Schaken en go zijn zogenoemde volledige informatiespelen. Met andere woorden: de computer weet precies welke zetten er zijn gedaan, welke stukken zijn geslagen en waar de open ruimten liggen.

Bluf

'Met onvolledige informatiespelen zoals poker werkt het zo niet', zegt Potter van Loon. 'Je weet niet welke kaarten de ander spelere heeft.' Dit maakt het voor een computer veel lastiger om de juiste keuzen te maken. Spelers moeten door ervaring, spelinzicht en kansberekening schatten wat de beste handeling is. Een bijzonder aspect aan poker is daarnaast het bluffen. Iets wat bij go natuurlijk geen rol speelt.

Libratus is door zijn makers daarom niet volgepompt met historische gegevens. Nee, de machine baseert haar strategie puur op basis van de regels van het pokerspel en het gedrag van de speler tegenover zich. Het systeem maakt hierbij gebruik van een methode waarbij de perfecte balans tussen beloning en risico wordt gezocht. Deze balans staat bekend onder de naam Nash-evenwicht, genoemd naar de Nobelprijswinnaar John Nash. In dit evenwicht handelt ieder groepslid volgens de beste strategie, rekening houdend met de mogelijke strategieën van alle anderen.

Nash-evenwicht

Het bekendste voorbeeld van een Nash-evenwicht is het gevangenendilemma. Hier moeten twee gevangenen A en B kiezen tussen bekennen of zwijgen voor een gezamenlijk begane misdaad. Ze weten niet wat de ander doet. Als ze beiden zwijgen krijgen ze ieder twee jaar straf. Als ze beiden bekennen, krijgen ze ieder vijf jaar en als één zwijgt en de ander bekent is het respectievelijk tien en nul jaar. Als ze met elkaar mochten overleggen, zou de beste strategie zijn: ontkennen. Als zowel A als B dat zouden doen, krijgen ze twee jaar. Dit is echter geen Nash-evenwicht. Het evenwicht is: beiden bekennen. Verandering van strategie zou immers onvoordelig zijn: je krijgt dan tien jaar voor je kiezen.

Doorbraak

Bij poker is dit bijzonder lastig. 'In de praktijk is het onmogelijk om alle mogelijke strategieën van je tegenstander helemaal door te rekenen. Er zijn simpelweg te veel mogelijkheden. Maar wat je met AI wél kan doen: er zo dicht mogelijk bij in de buurt komen', aldus Potter van Loon.

Dat ging wonderbaarlijk goed. 'Een doorbraak', zegt ook Potter van Loon. 'Wat ik vooral erg goed vind aan de opzet van dit toernooi is dat de menselijke spelers in verschillende teams en met roulerende kaartensets tegen de computer spelen. Via deze weg wordt het effect van kans grotendeels uitgesloten.' De computer heeft geen voor- of nadeel door goede of slechte kaarten toegedeeld te krijgen. Voor Potter van Loon toont de overwinning aan dat zelfs de beste pokerspelers klaarblijkelijk nog vrij ver van 'perfect play' verwijderd zijn.

De overwinning gaat verder dan alleen de pokerwereld. De algoritmen waarvan Libratus gebruikmaakt, kunnen overal worden ingezet waar nu nog mensen onderhandelen op basis van onvolledige informatie. In het bedrijfsleven bijvoorbeeld of bij militaire crises. Dit leidt niet overal tot blije gezichten. 'Poker is wel het laatste waar we ons zorgen over maken', zegt computerwetenschapper Roman Yampolskiy van de University van Louisville tegenover the Guardian. 'We hebben nu een machine die ons ook verslaat bij militaire toepassingen. Ik maak me zorgen hoe de mensheid als geheel daarmee omgaat.'

Volgens Potter van Loon zegt deze AI-overwinning echter nog niet zo veel over andere toepassingen. 'Een spel als poker is weliswaar complex ten opzichte van overige spelen, maar enorm simpel vergeleken met processen in de echte wereld. Bij poker is er een vast aantal mogelijke situaties en acties die volledig te kwantificeren zijn.'

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 DPG Media B.V. - alle rechten voorbehouden