Kunstmatige intelligentie Robotjournalistiek

Nog even en de robotjournalist schrijft ook voor Nederlandse media

Beeld Van Santen & Bolleurs

Binnenkort waarschijnlijk ook in Nederlandse media: door de computer geschreven artikelen. Al heeft de robotjournalist soms nog ‘hallucinaties’.

‘Ajax haalde tegen Real Madrid een eersteklas huzarenstukje uit. De uitploeg heeft dinsdagavond met 1-4 gewonnen van de ploeg van manager Santiago Hernán Solari Poggio.’

Niet zo soepel als het stuk dat onze voetbalverslaggever Willem Vissers dinsdag over de wedstrijd Real Madrid-Ajax schreef, maar toch: niet slecht voor een computer. Deze intro vloeide uit de virtuele pen van Pass, een programma dat is ontwikkeld door de Universiteit van Tilburg. Het tikt zelfstandig voetbalverslagen op basis van gegevens als de eindstand, namen van doelpuntenmakers en uitgedeelde kaarten.

Bijzonder aan Pass is dat het zijn doelgroep kent. Over het treffen van Ajax en Real Madrid schreef hij voor de achterban van het verliezende Real een heel andere intro. ‘In Estadio Santiago Bernabéu kon Real Madrid dit keer geen vuist maken. Tegen Ajax kwam de ploeg van manager Santiago Hernán Solari Poggio niet tot winst: 1-4.

Toch publiceren Nederlandse nieuwsmedia nog altijd geen automatisch gegenereerde teksten. Elders is dat anders. Bij de Amerikaanse nieuwsdiensten Associated Press, Bloomberg en Reuters doorvlooit de robotjournalist al jaren financiële verslagen van bedrijven om de cijfers samen te vatten in een nieuwsberichtje. De Los Angeles Times heeft QuakeBot, dat minuten na een aardbeving een berichtje de wereld instuurt. En begin dit jaar publiceerde Guardian Australia het eerste automatisch geproduceerde nieuwsbericht van het land, over donaties aan politieke partijen. Het zijn slechts enkele voorbeelden.

In al deze gevallen doet de computer een invuloefening, op basis van door mensen geschreven ‘templates’, sjablonen. Op [Datum wedstrijd] won [Winnaar] van [Verliezer] met [Eindstand], dat werk. Niet voor niets zijn schrijvende programma’s vooral nuttig voor afgebakende onderwerpen met heldere cijfers. Zoals beursberichten, weersverwachtingen en sportuitslagen.

Ook de digitale voetbaljournalist Pass werkt met dergelijke templates, zegt hoogleraar Emiel Krahmer van de Universiteit van Tilburg, een van de ontwikkelaars van het systeem. Voordat ze die templates schreven, lieten de Tilburgse onderzoekers een statistische analyse los op meer dan twaalfhonderd teksten, om het taalgebruik van sportjournalisten te analyseren.

Speciaal voor u geselecteerd

Er zijn meer smaken van automatisering in de journalistiek dan door computers geschreven teksten. Het Financieele Dagblad wil gepersonaliseerde lijsten met artikelen aanbieden, bijvoorbeeld in een nieuwsbrief of op de website. Een computerprogramma moet die deels afstemmen op het interesseprofiel van de lezers, vertelt David Graus, datawetenschapper bij de krant. Eind deze zomer moet de functie werken. ‘Al blijven we zelf een hand houden in wat nieuwswaardig is en wat niet. We willen niet dat mensen in een filterbubbel belanden.’ Eind dit jaar moeten automatisch gegenereerde aanbevelingstekstjes aan deze lijsten worden toegevoegd, vervolgt hij. Wederom gepersonaliseerd: de computer licht onderdelen uit die de lezer het meest interesseren.

Niet dat het onmogelijk is om een kunstmatig intelligent systeem te bouwen dat wél helemaal zelf teksten schrijft, zonder templates. Krahmer werkt mee aan een zelflerend programma dat op basis van duizenden bestaande artikelen over voetbal leert schrijven. Alleen is die nog lang niet klaar voor de krantenkolommen.

Zo heeft het programma last van ‘hallucinaties’, legt Krahmer uit. Bij het kopiëren van taalgebruik van bestaande teksten neemt het ook weleens een stukje inhoud mee dat niet van toepassing is. ‘Nacer Barazite schoot de bal hard in de kruising’, tikte het programma eens op, terwijl het helemaal geen informatie had gekregen over de plek waar de bal in het doel belandde. Laat staan hoe hard. Een mooie illustratie dat de computer niet werkelijk begrijpt waarover hij schrijft.

Het Pass-systeem staat stukken dichter bij een praktische toepassing. AD/Utrecht test het uit. De regionale krant wil verslagen leveren van lokale voetbalwedstrijden uit lagere klassen, vertelt Rennie Rijpma, adjunct-hoofdredacteur digitaal van het Algemeen Dagblad. Wedstrijden waarvoor journalisten geen tijd hebben en waarin een beperkte groep is geïnteresseerd.

Eind dit jaar eindigt het onderzoeksproject en moet er iets werkbaars liggen, aldus Rijpma. ‘Al denk ik niet dat die eerste oplevering al tot publiceerbare resultaten leidt. Het is nog erg basic. Zelf denk ik dat Pass een soort eerste kladversies kan leveren waarop journalisten kunnen voortborduren. Met afwisselender taalgebruik, extra context of een interviewtje, bijvoorbeeld.’

Dit soort projecten zijn er meer in Nederland. RTL wil lokaal nieuws aanbieden, zegt Jasper Bunskoek, datajournalist bij RTL Nieuws. Melden of het aantal verkeersongelukken in een gemeente stijgt of daalt, bijvoorbeeld. De gegevens zijn te vinden in databases als die van Rijkswaterstaat, een computer moet ze alleen nog inlijsten in goedlopende zinnen. Eind dit jaar hoopt RTL Nieuws een prototype af te hebben, liefst een die al op de site te vinden is.

Ondertussen kijkt Nu.nl of het een soortgelijk programma wil overnemen, al in gebruik bij de Finse krant Helsingin Sanomat. Dat kan bijvoorbeeld berichten afleveren over sportuitslagen of werkloosheidscijfers. ‘Maar het is nog in een prematuur stadium, we hebben nog veel vragen’, aldus hoofdredacteur Gert-Jaap Hoekman. ‘Bij welke onderwerpen voegen automatisch gegenereerde berichten echt iets toe aan wat we al doen? Gaan we zulke berichten meteen plaatsen of is het ruw materiaal waar een journalist op kan voortborduren?’

Is de journalist straks overbodig? Die angst steekt elke keer de kop op als een nieuwe vorm van technologie journalistiek werk kan overnemen, zegt Mark Deuze, hoogleraar mediastudies aan de Universiteit van Amsterdam. ‘Dat was ook zo toen de radio opkwam in de jaren tien en twintig, de televisie in de jaren zeventig, het world wide web in de jaren negentig. Al verscherpt de discussie nu de technologie autonomer wordt.’

Toch is Deuze hoopvol. ‘Wat de schrijvende journalist onderscheidt van het algoritme, is creativiteit. In de interpretatie, de manier van opschrijven, het combineren van tekst en beeld. Menselijke journalisten kunnen meer dan droge feiten doorgeven.’

Slimme computersystemen kunnen ‘ambachtelijk oninteressante’ stukjes produceren, waarbij de feiten al klaarliggen, vervolgt de hoogleraar. Voor het echte tegels lichten blijft de journalist nodig. 

Bovendien kan de computer feiten opsnorren voor de journalist of zelfs verhaalideeën opperen. Als de omzet van een bedrijf opvallend snel stijgt, bijvoorbeeld. Reuters ontwikkelde met dat doel Lynx Insight, dat financiële data doorspit op zoek naar opvallende trends.

Maar het is een valkuil om blind op de computer te vertrouwen, vindt Deuze. Ook die kan verkleuringen weergeven die voortkomen uit de menselijke data die ze interpreteren. ‘Dus blijft een wisselwerking nodig tussen de computer en de mens’, concludeert hij. ‘Het blind uitbesteden van stukken zie ik journalisten niet doen. Dat botst met de beroepseer, daarvoor ben je niet het vak ingegaan.’

Wat de computer nog meer kan (en wat nog niet)

De computer kan steeds meer menselijke taken overnemen. Zoals nieuwe soorten parfum bedenken, zoals je in dit artikel leest. En ja, zelfs het maken van kunst

Er is ook genoeg dat de computer nog niet kan. Lees hier hoe de menselijke robot Sophia lang zo menselijk niet is als ze vaak wordt gepresenteerd.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 DPG Media B.V. - alle rechten voorbehouden