De volgende uitdaging voor de computer is poker

Nu de computer eerste de beste schakers en onlangs de beste Go-speler heeft verslagen, is het tijd voor de volgende stap. Kunstmatige intelligentie neemt het op tegen de beste pokerspelers. Poker is fundamenteel anders dan Go omdat de computer bij poker niet alle informatie heeft.

Een casino in Las Vegas Beeld ap

De overwinningen op de beste schaker (in 1997) en beste Go-spelers (recent) door kunstmatige intelligentie worden gezien als mijlpalen in de strijd tussen mens en machine. Het zijn al eeuwenlang de spelen waar de mens op de toppen van zijn denkkracht wordt geacht te acteren. Poker is andere koek.

Deze week begint in het Rivers Casino Pittsburgh een twintig dagen durend toernooi waarbij vier professionele pokerspelers (Jason Les, Dong Kim, Daniel McAulay en Jimmy Chou) met de computer gaan strijden om een prijzenpot van 200 duizend dollar. Deze AI (Artifical Intelligence (red.)-machine genaamd Libratus is gemaakt door een team van de Carnegie Mellon University uit Pittsburgh.

Poker valt niet te vergelijken met schaak of Go, legt econometrist en pokeronderzoeker Rogier Potter van Loon uit. Schaken en Go zijn zogenoemde volledige informatiespelen. Met andere woorden: de computer weet precies welke zetten er zijn gedaan, welke stukken zijn geslagen en waar de open ruimtes liggen.

'Met onvolledige informatiespelen zoals poker werkt het zo niet', zegt Potter van Loon. 'Je weet niet welke kaarten de ander speler heeft.' Dit maakt het voor een computer veel lastiger om de juiste keuzes te maken. Spelers moeten door ervaring, spelinzicht en kansberekening inschatten wat de beste handeling is. Een bijzonder aspect aan het poker is daarnaast het bluffen. Iets wat bij Go natuurlijk geen rol speelt.

De specifieke variant die deze maand wordt gespeeld (No-Limit Texas Hold'em genoemd), is voor de computer nog eens extra moeilijk omdat de spelers op elk moment hun hele stapel fiches mogen inzetten. Er zijn wel eerdere krachtmetingen geweest tussen mens en machine bij poker, maar daarbij ging het om andere varianten of om mindere spelers.

Nash-evenwicht

In tegenstelling tot bij de strategische bordspelen waar de machine al heer en meester is over het menselijk geploeter, maakt Libratus gebruik van een methode waarbij de perfecte balans tussen beloning en risico wordt gezocht. Deze balans staat bekend onder de naam Nash-evenwicht, genoemd naar de Nobelprijswinnaar John Nash, grondlegger van de speltheorie. In een Nash-evenwicht handelt ieder groepslid volgens de beste strategie, rekening houdend met de mogelijke strategieën van alle anderen.

Maar bij poker is dit bijzonder lastig. 'In de praktijk is het onmogelijk om alle mogelijke strategieën van je tegenstander helemaal door te rekenen. Er zijn simpelweg te veel mogelijkheden. Maar wat je met AI wél kan doen: er zo dicht mogelijk bij in de buurt komen', aldus Potter van Loon.

Libratus is door zijn makers daarom ook niet volgepompt met historische gegevens. Nee, de machine baseert zijn strategie puur op basis van de regels van het pokerspel en het gedrag van de speler tegenover zich. Eind deze maand zullen we zien of ook dit bastion zal zijn geslecht. Heeft de computer dan eindelijk de Eindoverwinning behaald? Nog lang niet. Momenteel worden computers in het diepe gegooid bij de videogame StarCraft. Zij worden hierbij geconfronteerd met voorwerpen temidden van een in duisternis gehulde landkaart. De computer zal terugverlangen naar zijn strijd met schaker Kasparov in 1997.

Aanstaande zaterdag in Sir Edmund: hoe AI zijn weg probeert te vinden in de videogame StarCraft: 'De computer heeft nog een flinke weg te gaan.'

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 DPG Media B.V. - alle rechten voorbehouden