Hoe zelflerende machines de wetenschap stukje bij beetje overnemen

De revolutie die wacht om ontketend te worden

In Go en schaken excelleren ze al, maar zelflerende machines die beter dan menselijke experts op donkere materie kunnen jagen? Ook in de wetenschap zal machine learning een revolutie ontketenen.

Foto Noël Loozen

Het lijkt misschien een lollig spelletje, zegt deeltjesonderzoeker Sascha Caron van de Radboud Universiteit in Nijmegen. Maar de games die hij de bezoeker van zijn webpagina mydarkmachine.org voorschotelt zijn wel degelijk bittere ernst. In het ene geval gaat het om gokken op het aantal sterren dat op vage röntgenfoto's van de Melkweg te zien is. Belangrijk voor wie naar donkere materie speurt, het spul dat onzichtbaar is maar met zijn zwaartekracht wel sterrenstelsels bij elkaar houdt. In het andere geval om de vraag of een gegeven deeltjesbotsing echt is of wilde fantasie. Iets wat voor labs als CERN van levensbelang is, waar men speurt naar de diepste wetten die de materie beheersen.

Dat buitenstaanders van zulke opdrachten niet veel bakken, is niet zo verwonderlijk. Daar hebben we wetenschappers voor. Opmerkelijker is dat Caron vorig jaar voor beide gevallen computersoftware ontwikkelde die ook menselijke experts ruimschoots het nakijken geeft. 'Als je zoals ik bent getraind in de deeltjesfysica, is dat in eerste instantie best wel even schrikken', geeft Caron toe. 'Vooral omdat deze software natuurlijk geen enkel idee van de onderliggende astronomie of natuurkunde heeft.'

In plaats daarvan zijn Carons computerprogramma's zelflerend. Bijvoorbeeld het programma dat de melkwegfoto's beoordeelt, leerde waar het op moet letten aan de hand van 1,2 miljoen kunstmatige foto's met een bekend aantal sterren. De deeltjessoftware kreeg zijn doorslaggevende gevoel voor hoofd- en bijzaken na een training met 300 duizend voorbeeldbotsingen uit de databanken van de LHC-superversneller in Genève.

Caron was deze week een van de organisatoren van een internationale workshop in Leiden op het gebied van wat tegenwoordig machine learning heet. Daar zaten in het Lorentzcentrum tientallen astronomen en astrofysici bijeen om meer te leren over de nieuwe technieken. Vooral bij de speurtocht naar donkere materie zouden zelflerende systemen enorm goed van pas kunnen komen, zegt de Amsterdamse astrofysicus prof Gianfranco Bertone, mede-organisator. 'Brute rekenkracht is vaak niet toereikend voor wat we proberen uit te vinden. En hoe dan ook een idiote verspilling van tijd en geld, omdat het intussen veel efficiënter kan. Je hoeft niet meer maanden te rekenen op een model.'

Zelflerende software haalt in andere domeinen wekelijks de krant. De ene keer verslaat een kunstmatig intelligent programma na intensieve training genadeloos de wereldkampioen Go, tot leedwezen van de fans en de kampioen zelf. De andere keer blijkt een computer aan de hand van eindeloos kijken naar voorbeeldpartijen schaak zomaar zelf de officiële regels van het spel te kunnen afleiden. Computers leren meer verdachte vlekjes op mri-scans zien dan getrainde artsen, Google en Facebook analyseren er handig onze datastromen mee, onze foto's, video en spraak. Tegelijk leiden berichten dat twee systemen een eigen taal hebben ontwikkeld die de bouwers niet kunnen ontcijferen ook tot het ongemakkelijke gevoel dat de machines echt de macht overnemen.

Natuurkundeconferentie

Dat het hard begint te gaan met de lerende machines en de wetenschap blijkt er ook uit dat komende week, op de jaarlijkse nationale natuurkundeconferentie in het Brabantse Veldhoven, een hele ochtend aan machine learning wordt gewijd. Een verkenning, noemt de organisator van die sessie Ivo van Vulpen, deeltjesfysicus bij het Nikhef in Amsterdam, het bescheiden. 'Eigenlijk komt deze ontmoeting vooral voort uit mijn nieuwsgierigheid naar wat er al allemaal gaande is en naar wat er allemaal mogelijk zou kunnen zijn.' Hij bepleit intussen al dat machine learning in het wetenschappelijk onderwijs wordt opgenomen. 'Voor onderzoekers gaat dit soort technieken net zo belangrijk worden als een gedegen training in programmeren of statistiek', schat hij.

Sprekers op de conferentie in Veldhoven variëren van deeltjesspeurders en donkere-materiejagers tot onderzoekers van eiwitstructuren en zachte vaste stoffen. Lerende computers blijken al all over, maar echt voorop loopt de natuurkunde niet, bekent Van Vulpen ook meteen. 'Fysici zijn erg gewend zelf technieken voor data-analyse te ontwikkelen, ook met computers en software. Dat kunnen we goed, maar juist dan is het is een hele stap om misschien toch maar de technieken van Google in te zetten.'

Alles komt bij machine learning aan op patroonherkenning, legt astrofysicus en donkeremateriejager Bertone uit. Wetenschappers maken theorieën die verbanden geven tussen oorzaak en gevolg, liefst in wiskundige formules. Maar inmiddels spelen zulke theorieën zich, in elk geval in zijn vak, gemakkelijk af in pakweg twintig dimensies. Exacte berekeningen zijn dan te ingewikkeld of gecompliceerd en elk geval tijdrovend.

Doe het zelf

Sinds donderdag kunnen geïnteresseerden zelf aan de slag met de algoritmen voor kunstmatige intelligentie van zoekgigant Google. Op het onlineplatform Cloud AutoML vinden gebruikers een digitale blokkendoos waaruit ze programma's kunnen samenstellen die helpen bij beeldherkenning en binnenkort ook spraak- en teksttoepassingen. Die leren gaandeweg wat de bedoeling is van voorbeelden die de gebruiker aandraagt, bijvoorbeeld gelabelde foto's.

Een theoreticus zal zich daarom concentreren op ogenschijnlijke hoofdzaken. Maar zonder zekerheid dat hij daarbij niets over het hoofd ziet. 'Zelflerende machines gebruiken geen intuïtie of fysische ideeën over wat belangrijk zou kunnen zijn, zoals een theoreticus misschien doet. De machine zoekt verbanden, of die nou begrijpelijk of logisch zijn of helemaal niet.'

Tegenover Bertones kantoor op Amsterdam Science Park zit informaticus Max Welling van de Universiteit van Amsterdam, met wie hij sinds enkele jaren samenwerkt. Welling is een theoretisch fysicus, gepromoveerd bij Gerard 't Hooft. Maar daarna raakte hij meer geïnspireerd door de belofte die Big Data en zelflerende computers voor de wetenschap betekenen. 'Dit is een vak waar je echt verschil kunt maken', zegt hij.

Er is, bezweert Welling, echt een revolutie op komst in de wetenschap. 'Ik vergelijk het graag met de opkomst van het internet. Eerst denk je nog: dit is een hype. Maar dan blijkt dat echt alles anders wordt. Er wordt inderdaad hier en daar wel wat overdreven. Maar inmiddels weet ik zeker dat dit niet meer weggaat.'

Zelflerende technieken

Dat computers een wezenlijke rol spelen in de wetenschap is een open deur. Ze worden overal gebruikt om data te analyseren en modellen door te rekenen. Deeltjesfysici sporen er onbekende piekjes in hun botsingsstatistieken mee op, planetenjagers vinden er verre zonnestelsels mee in flikkeringen van miljoenen sterren. Taalwetenschappers ontmaskeren er anonieme schrijvers mee, of ontdekken literaire verwantschappen. Tot voor kort bedachten de onderzoekers waarop hun computersystemen dan moesten letten. Met zelflerende technieken onthoudt de software hoe een goed datapunt eruitziet en zoekt met dat voorbeeld naar meer.

In feite, zegt Welling, is dat best vergelijkbaar met hoe menselijke wetenschappers werken: ze nemen waar, menen patronen te zien die om een wetenschappelijke verklaring vragen, een model of zelfs een theorie. De eerste paar stappen kunnen zelflerende computers ook uitvoeren, en vaak zelfs beter en zonder ooit moe te worden. 'Dat je niet zelf een piekje of verband vindt, maar een zwarte doos, is vooral een kwestie van wennen', zegt hij.

Foto Noël Loozen

Van het spookbeeld dat machines de wetenschap overnemen wordt hij eerlijk gezegd een beetje giechelig. 'Het hangt er vanaf op welke termijn je praat. Over duizend jaar zijn er vast theorieën die door een computerintelligentie zijn ontdekt. Maar voorlopig hebben we het gewoon over een nieuw hulpmiddel dat het makkelijker maakt om gecompliceerde vraagstukken aan te pakken.'

Fysicus Sascha Caron in Nijmegen ziet dat in de praktijk van het deeltjesonderzoek op bijvoorbeeld CERN al volop gebeuren. De grote LHC-versneller daar spuwt onvoorstelbaar veel waarnemingen van botsende deeltjes uit, waarmee theoretici geacht worden hun theorieën en modellen te testen. Is een voorspeld deeltje of effect onvindbaar, dan is zo'n model van de baan. Maar meer en meer is ook de omgekeerde route aan de orde. Dan komen via patroonherkenning uit de massa's data onverwachte fenomenen naar voren die om nieuwe verklaringen vragen.

In die zin nemen zelflerende machines inderdaad de wetenschap wel degelijk al een beetje over, filosofeert Caron. 'Het zal vaker gebeuren dat intelligente machines de onderzoeksagenda gaan bepalen door ons te wijzen op dingen die we niet gezien of bedacht hadden.' Hij kan, geeft hij toe, niet wachten.