Schaken kan de computer al, nu op naar nieuw level

Kunstmatige intelligentie

Schaken kan hij al. Nu moet de computer StarCraft onder de knie zien te krijgen. Want die onvoorspelbare game is een prachtig oefenterrein voor de echte wereld.

Een Gamer speelt Starcraft. Beeld getty

Het spel begint. Je overziet maar een klein stukje van een in duisternis gehulde landkaart, met in het midden een gebouwtje en alien-achtige figuurtjes. Na wat klikken ontdek je dat de figuurtjes grondstoffen kunnen verzamelen en daarmee gebouwen kunnen neerzetten - die op hun beurt weer nieuwe mannetjes produceren. Terwijl je je ongans klikt om alles en iedereen bezig te houden, doemen er ineens figuurtjes op uit het deel van de kaart dat je nog niet kunt zien. Een aanval! Gelukkig heb je inmiddels wat soldaatjes - maar helaas: veel minder dan de vijand, die je hele basis dus zonder enige moeite met de grond gelijk maakt. Oké, volgende keer sneller te werk gaan. Poging twee.

Als je een videogame als StarCraft onder de knie probeert te krijgen, is dat in eerste instantie een frustrerende aangelegenheid. Maar troost je: voor een computer is het nog veel moeilijker om zo'n spel te leren; op dit moment zelfs onmogelijk. Er wordt echter hard gewerkt om daar verandering in te brengen. Onderzoekers van onder meer Facebook bouwden TorchCraft, een platform dat leertechnieken voor computers beschikbaar maakt voor StarCraft. En het Google-bedrijf DeepMind gooide het vervolg op de game open voor programmeurs wereldwijd. Want als artificial intelligence (AI) eenmaal kan dealen met iets als StarCraft, komt straks ook de echte wereld binnen bereik.

Computers en spellen zijn een logische combinatie, zegt Aske Plaat, hoogleraar Data Science aan de Universiteit Leiden. 'Games hebben al sinds het begin van AI een belangrijke rol gespeeld, omdat het makkelijker is onderzoek te doen in een afgesloten wereldje, zoals naar gedrag dat zich moet aanpassen aan veranderende omstandigheden. Dat werkt veel beter dan zoiets in de echte wereld testen, waar je arme robotje of programmaatje onverwachts van alles kan overkomen dat het écht niet aankan.'

Gamers in Seoul spelen Starcraft om de computer in het spel te trainen. Beeld getty

In het verleden zijn op dit vlak dan ook grote successen geboekt. Twintig jaar geleden wist IBM's computer Deep Blue wereldkampioen schaken Gari Kasparov te verslaan. En vorig jaar werd een nieuwe mijlpaal bereikt, toen het programma AlphaGo van het eerdergenoemde DeepMind Lee Sedol overtroefde, de op een na beste go-speler ter wereld.

Maar hoe ingewikkeld schaken en go ook zijn: voor een computer zijn ze op een aantal vlakken juist eenvoudig. Je kunt bijvoorbeeld op elk moment het hele bord overzien. Ook doen spelers netjes om de beurt één zet, waarbij elk van die zetten direct wordt uitgevoerd zonder kans op mislukken. Als je met je koningin van c3 naar f6 gaat, kan het speelstuk niet in een hinderlaag belanden terwijl het van het ene naar het andere vakje beweegt.

Vergelijk dat met StarCraft. Daar is een groot deel van de kaart aanvankelijk in duisternis gehuld, waardoor je geen idee hebt wat je tegenstander allemaal bekokstooft. Ook voeren de spelers niet om de beurt, maar tegelijkertijd acties uit. En het kan ook nog eens even duren voor die acties zijn voltooid, waarbij de spelsituatie intussen blijft veranderen. Bovendien biedt het spel de spelers veel meer mogelijkheden. Waar je bij een potje schaken gemiddeld 35 opties hebt om uit te kiezen, zijn dat er in StarCraft ongeveer een miljoen.

Die eigenschappen maken StarCraft voor een computer tot een ingewikkeld spel, maar ook tot een waardevol oefenterrein voor de echte wereld. Neem bijvoorbeeld een robot die het huishouden voor je doet. Die krijgt geen overzichtelijk schaakbord, maar een rommelig huis voor zijn kiezen. En in dat huis kan het zomaar gebeuren dat een van die onvoorspelbare menselijke bewoners in een andere kamer een vaas verplaatst. Daar moet zo'n robot dan wel mee om kunnen gaan, net zoals hij in StarCraft moet kunnen dealen met een tegenstander die in het in duisternis gehulde deel van de kaart op elk moment elke denkbare actie kan uitvoeren.

Gamers in Seoul spelen StarCraft om de computer te trainen. Beeld getty

Het echt goed spelen van StarCraft is al een hele toer voor een computer, maar AI-onderzoekers hebben de lat nog een stukje hoger liggen. 'Ons doel is om een kunstmatige intelligentie het spel op eigen houtje te laten leren', zegt Nantas Nardelli, een door Microsoft betaalde promovendus aan de Universiteit van Oxford die samenwerkt met onderzoekers van Facebook. 'Dat is vele malen complexer, maar het zal uiteindelijk meer impact hebben op het AI-onderzoek.'

Het is al gelukt om computers eenvoudige videogames onder de knie te laten krijgen. Neem Breakout uit 1976, waarin je met een beweegbaar balkje een balletje tegen een muur van blokjes moet laten stuiteren om die te slopen. Een computer krijgt dan simpelweg de opdracht 'haal zoveel mogelijk punten', neemt de pixels op het scherm waar en experimenteert net zo lang totdat hij is gestuit op een werkwijze die hem een high score oplevert. (In het geval van Breakout: eerst ontdekken dat je met het balkje het balletje moet tegenhouden, dan dat je het balletje áchter de muur moet zien te krijgen, zodat het daar heen en weer stuitert en snel alle blokjes wegtikt.)

Via een scherm volgen fans de partij die het programma AlphaGo won van grootmeester Lee Sedong. Beeld afp

StarCraft is echter zoveel complexer dan Breakout dat een computer volledig in het diepe gooien voorlopig niets oplevert, zegt Nardelli. 'In plaats daarvan moet je hem zoveel mogelijk data over de staat van het spel geven, en hem toestaan om acties te gebruiken als 'verplaats deze eenheid' of 'val die vijand aan'.' Om die tweede strategie naar een hoger plan te tillen, hebben hij en zijn team TorchCraft ontwikkeld. Dit is een platform dat een brug slaat tussen de game en Torch, een softwarebibliotheek bomvol algoritmes op het gebied van onder meer machine learning en beeldverwerking. Hierdoor hoeft de computer niet bij nul te beginnen.

En nu zijn anderen aan zet. Het team van Nardelli heeft namelijk niet voor niets StarCraft uitgekozen. Rond het spel bestaat een bloeiende gemeenschap van spelers die al jaren proberen een zo goed mogelijke computerspeler te ontwikkelen. Die gemeenschap heeft met TorchCraft het gereedschap gekregen om de nieuwste leertechnieken in te zetten, wat het AI-onderzoek rond de game een boel moois moet opleveren. Daarnaast heeft DeepMind - het Google-bedrijf dat het go-spelende programma AlphaGo ontwikkelde - met spelontwikkelaar Blizzard het veel geavanceerdere StarCraft II onlangs opengegooid voor AI-deskundigen. Ook daar is de gedachte: laat maar zoveel mogelijk fanatiekelingen er lekker mee experimenteren, want dat moet haast wel wat opleveren.

Een screenshot uit het spel StarCraft.

Een nuttige weg om in te slaan? Ja, zegt Aske Plaat volmondig. 'En ik ben niet de enige die dat vindt. Begin december was ik op een drukbezochte conferentie over machine learning in Barcelona en daar was er een overweldigende belangstelling voor in het gebruik van games.' Toepassingen ziet Plaat overal. 'Automatische piloten, advertenties die zich aanpassen aan gebruikers, spraakherkenning, juridische argumentatie, beeldherkenning door drones... Dit soort onderzoek draagt bij aan voortgang op alle gebieden waarin complexe interacties tussen mensen en machines plaatsvinden.'

Hoe snel we dat soort resultaten mogen verwachten, is alleen moeilijk te voorspellen, zegt Plaat. 'Het heeft tientallen jaren geduurd voordat automatisch vertalen enigszins werkte.' De computer heeft nog een flinke weg te gaan. Confronteer hem nu onvoorbereid met een scherm waarop een gebouwtje prijkt omringd door een in duisternis gehulde landkaart en hij heeft geen flauw benul wat hij ermee aan moet. Laat staan dat hij de opgedane ervaring al kan inzetten om je huis aan kant te maken.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright@volkskrant.nl.