Analyse Lezende computers

Hoe kunstmatige intelligentie nieuwe kennis opduikt uit miljoenen wetenschappelijke artikelen

Beeld Studio V

De boekenkast van de wetenschap is volkomen onbehapbaar, zo groot. Gelukkig leest de computer tegenwoordig ook zeer aardig – en heel wat sneller dan wij.

Het was nog komische sciencefiction, toen in de jarentachtigfilm Short Circuit een robot de wereld leerde kennen door boeken in luttele seconden door te ploegen, terwijl zijn mechanische arm als een op hol geslagen flipperkast de bladzijden omsloeg: ‘Input, more input!’

Maar zoals wel vaker bij het sciencefictiongenre wordt die fictie zo langzamerhand realiteit. Het zijn weliswaar geen fysieke robots, maar er bestaan al wel computerprogramma’s die in sneltreinvaart door teksten razen, op jacht naar waardevolle informatie. Nu is de tijd aangebroken dat ze wetenschappers bijstaan door oude kennis op te duiken en zelfs nieuwe ontdekkingen doen.

Het is onvoorstelbaar hoeveel kennis onderzoekers jaar in jaar uit verzamelen, terwijl ze onvermoeibaar experimenteren in laboratoria, sleutelen aan computermodellen en rondspeuren tijdens veldwerk. Alleen al vorig jaar resulteerde dat volgens uitgeversvereniging STM in drie miljoen wetenschappelijke artikelen; in totaal bestaan er daar inmiddels tientallen miljoenen van.

Een kunstmatig intelligent computerprogramma kan uit die onbevattelijke papierbak nieuwe kennis destilleren, schrijven Amerikaanse onderzoekers in een artikel in vakblad Nature. In het door hen beschreven geval gaat het om materialen die nuttig blijken voor elektronische toepassingen, van zonnepanelen tot computerchips.

De onderzoekers begonnen met een computer die geen weet had van wat voor materiaal dan ook. Die kreeg 3,3 miljoen samenvattingen (abstracts) te verwerken van publicaties uit de materiaalwetenschappen. Door de positie van woorden binnen de context van al die teksten te analyseren, leerde de computer zichzelf hoe de taal in elkaar zit. Hij herkende bijvoorbeeld welke woorden staan voor materialen, met soms weinig pakkende namen als bismuttelluride, en welke voor de eigenschappen van deze materialen.

Hierna legde de computer een grote hoeveelheid verbanden tussen al die materialen en eigenschappen. Verschillende materialen die ‘thermo-elektrisch’ zijn – onder meer nuttig voor het omzetten van hitte in elektriciteit – bleken bijvoorbeeld meer eigenschappen met elkaar te delen. Op basis van die andere eigenschappen lepelde de computer ook andere materialen op die thermo-elektrisch kunnen zijn, zelfs al werd dit nooit eerder aangetoond of zelfs maar vermoed.

Hier zaten onzinnige voorspellingen tussen, voor de hand liggende voorspellingen en een aantal suggesties die onverwacht en intrigerend zijn, mailt materiaalwetenschapper Anubhav Jain, medeauteur van de studie. Die laatste categorie vindt hij het spannendst: ‘Daar kunnen nieuwe klassen thermo-elektronica tussen zitten.’

Zo verlaat dit type kunstmatige intelligentie (natural language processing is de vakterm – natuurlijke taalverwerking) na jaren van ontwikkeling de computer van de programmeur om toegepast te worden in heel andere wetenschappelijke vakgebieden. Dit tot plezier van Suzan Verberne, die als datawetenschapper aan de Universiteit Leiden zelf al jaren werkt aan natural language processing.

Verberne is een wandelend voorbeeld van de wijze waarop deze vorm van kunstmatige intelligentie doorsijpelt in andere vakgebieden: als informaticus begeleidt ze nota bene het promotietraject van een archeoloog.

Hoe dat zit? Telkens als in Nederland een archeologische vondst wordt gedaan, bijvoorbeeld tijdens een afgraving voor de bouw van nieuwe huizen, zijn archeologen verplicht die vondsten te documenteren, vertelt ze. ‘Er zijn tienduizenden van zulke archeologische rapporten met locaties en gevonden artefacten, zoals bijlen en potten. Soms beslaan ze een paar A4’tjes, soms zijn ze honderden pagina’s lang. Veel te veel om door te ploegen.’

Dus werkt Verberne mee aan een intelligente zoekfunctie die al die rapporten eenvoudig doorzoekbaar moet maken voor archeologen. Om de juiste teksten eruit te kunnen pikken, gebruikt ook zij programma’s met een vorm van tekstbegrip, zodat de computer ook rapporten kan aanreiken die geen van de zoekwoorden bevatten maar desondanks relevant zijn.

Volgende week presenteert ze een studie naar patenten en de referenties naar wetenschappelijk onderzoek die daarin staan. ‘Dat is nuttig om te bestuderen wat voor soort onderzoek daadwerkelijk leidt tot uitvindingen. Of om bijvoorbeeld te kijken of interdisciplinaire onderzoeksteams tot meer succesvolle commerciële toepassingen komen’, zegt ze. De functie van een computer die tempo maakt met lezen laat zich raden, als je de eerste cijfers ziet: ‘We hebben 500 duizend nieuwe links gevonden tussen wetenschappelijke artikelen en patenten in het veld van biotechnologie.’

Patenten, materiaalwetenschappen, archeologie: het illustreert de breedte van de onderwerpen waarbij computers met taalgevoel kunnen helpen. Volgens Verberne is het goed denkbaar dat ze straks ook bijdragen aan het ontdekken van niet eerder gelegde verbanden tussen bijvoorbeeld genen en kanker, om maar wat te noemen.

Onderzoekers mogen dus in hun handjes knijpen met de hulp van die slimme datawetenschappers en hun kunstmatig intelligente computerprogramma’s. Al heeft Verberne daarover nog wel wat op te merken. ‘Vaak wordt gedacht dat wij er als datawetenschapper vooral zijn om anderen te helpen. Maar het is ook andersom: nieuwe onderwerpen stellen ons voor nieuwe uitdagingen om onze methoden te verbeteren. Het is echt niet zo dat wij een soort loodgieters van de universiteit zijn.’

Meer over de stormachtige ontwikkeling van kunstmatige intelligentie

Eerst schaken, toen Go, nu computergames: lees hier waarom het nuttig is om kunstmatige intelligentie spelletjes te leren spelen.

Zo werd een worstelende voetbalclub uit Engeland gered door een supercomputer.

We spraken de meesterparfumeur die nieuwe geurtjes maakt met behulp van kunstmatige intelligentie.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 de Persgroep Nederland B.V. - alle rechten voorbehouden