Nieuwe software maakt van politici digitale handpoppen

Geloof niet wat u ziet, noch wat u hoort: dankzij manipulatie software en intelligente algoritmen wordt het maken van nepvideo's steeds makkelijker.

We zien het hem zelf zeggen, met zijn donkere lokken en montere blik: Jesse Klaver pleit op het Binnenhof voor de privatisering van het onderwijs. Even twijfelen we, klopt dit wel? Maar het is toch echt Klavers mond die beweegt en zijn stem die spreekt: dit kan geen nepnieuws zijn. Of... wel dus. Met de huidige technologieën voor beeld- en geluidsmanipulatie is het maken van zo'n filmpje bijna een fluitje van een cent.

Op YouTube toont een indrukwekkende video de stand van zaken. Links in beeld zien we een computerscherm met het gezicht van George Bush tijdens een persconferentie. Rechts, gezeten op een stoel voor dat beeldscherm, zien we Justus Thies, onderzoeker grafische dataverwerking van de universiteit van Erlangen-Neurenberg. Thies beweegt zijn mond, trekt zijn wenkbrauwen op, maakt vreemde grimassen. Een gewone webcamera registreert alles. Op het beeldscherm kopieert Bush de bewegingen van de onderzoeker nauwgezet, als een digitale marionet. Hetzelfde trucje haalt Thies uit bij Poetin en Obama.

De software hiervoor, Face2Face, is ontwikkeld door Thies en collega's van Stanford University en het Max Planck Instituut voor Informatica. Een oudere demonstratie laat iets vergelijkbaars zien, maar dan met twee onderzoekers. Ze zitten naast elkaar aan een bureau en ieder van hen kijkt in een eigen webcamera, die op tafel staat. Computerschermen achter hen tonen realtime hun gezichten, opgenomen door de twee webcams. Er is alleen iets vreemds aan de hand: het gezicht van de linker onderzoeker blijkt te worden aangestuurd door de rechter. Een webcam en wat software volstaan dus om videobeelden al op het moment van opname te manipuleren.

'Voor leken ziet het er indrukwekkend uit, maar het is natuurlijk wel een laboratoriumopstelling', relativeert Theo Gevers, hoogleraar computer vision van de Universiteit van Amsterdam. 'De setting voldoet aan allerlei randvoorwaarden: de belichting moet uniform zijn en de acteur mag zijn hoofd niet te ver draaien, want dan raakt de computer de kluts kwijt.'

Zelf ontwikkelt hij software voor de animatie van gezichten, vergelijkbaar met intelligente algoritmen als Face2Face. 'Vooraf maak je een standaard driedimensionaal model van een hoofd', legt hij uit. 'Daaroverheen leg je het gezicht dat je wilt manipuleren. Over beide gezichten ligt een raster van punten die veranderen bij beweging: rond de mond, bij de ogen, de wangen, de wenkbrauwen. Als er punten bewegen bij de acteur, laat je dezelfde punten meebewegen bij het tweede gezicht.'

Nepmiddelvinger

Een filmpje waarin Yanis Varoufakis het publiek zijn middelvinger toont zorgde in 2015 voor veel ophef. De beelden bleken opgenomen tijdens een congres in 2013. Daar ried Varoufakis zijn land aan Duitsland de middelvinger te tonen - zonder het zelf te doen. Twee jaar later verving het Duitse satireprogramma Neo Magazin Varoufakis' hand met Photoshop door een exemplaar met opgestoken middelvinger.

Voor de binnenzijde van de mond voegden de onderzoekers een los 3D-model toe, gebaseerd op eerdere, al bestaande beelden van het gemanipuleerde gezicht. Bij eerdere software verraadde de kunstmatige binnenzijde van de mond - een zwart vlak met een witte rij neptanden - de bewerking.

Het doet denken aan de manier waarop acteurs in animatiestudio's tekenfilmhelden leven inblazen. De technologieën die wetenschappers als Thies en Gevers ontwikkelen, worden dan ook vaak toegepast in de wereld van vermaak, gaming en virtual reality. Reuzemooi allemaal, maar wat als lolbroeken of kwadere geesten dezelfde technologie gebruiken om een staatshoofd ongewild allerlei raars te laten verkondigen?

Gehoorzame pop

Natuurlijk is daarvoor ook spraakmanipulatie nodig, een ander vakgebied waar de technologie griezelig ver is gevorderd. Zo presenteerde Adobe (bekend van Photoshop) afgelopen jaar het programma VoCo, waarmee je kunt knippen en plakken in gesproken tekst. Zo kun je dus Klavers stem gebruiken voor een ultrarechtse toespraak.

Wat je hiervoor nodig hebt is 20 minuten brontekst, uitgesproken door de GroenLinkser. Intelligente algoritmen hakken de tekst op in losse woorden en klanken. Wanneer je vervolgens een tekst intikt, zoekt het algoritme de benodigde woorden in het bronmateriaal en zet ze in de juiste volgorde. Ontbrekende woorden maakt het algoritme zelf uit losse klanken.

Lyrebird, een Canadese spin-off van onderzoek aan de universiteit van Montreal, presteert ongeveer hetzelfde op basis van slechts een halve minuut brontekst. Het resultaat klinkt hier en daar nog blikkerig, maar is toch indrukwekkend.

Iedereen met de juiste technologie kan Klaver dus laten spreken en bewegen als een gehoorzame pop. Stinken we er allemaal in, of is er een manier om de filmpjes te ontmaskeren? Jawel, momenteel verraden kleine artefacten de manipulaties nog, zegt Gevers. 'Je ziet het bij Face2Face bijvoorbeeld aan foutjes in de belichting, waardoor de textuur van het gezicht net iets anders is. Ook de fijnheid van expressie is nog beperkt, dus bepaalde complexe gezichtsuitdrukkingen zijn niet mogelijk.'

Detectiesoftware

De oplossing van dat soort problemen is volgens de hoogleraar een kwestie van tijd en rekenkracht. 'Bij een schilderij is een vervalsing makkelijker te herkennen, omdat je te maken hebt met fysieke materialen. Pixels kun je oneindig manipuleren. Het is vooral belangrijk dat mensen beseffen dat ook video's zijn te veranderen, dat ze niet alles klakkeloos moeten geloven.'

Dezelfde waarschuwing geven de wetenschappers achter Face2Face in interviews. Ze zijn daarnaast begonnen met het ontwikkelen van detectiesoftware. Ook de oprichters van Lyrebird beseffen dat hun uitvinding belangrijke ethische consequenties heeft. Op hun website waarschuwen ze bijvoorbeeld voor het rotsvaste vertrouwen in stemopnamen als bewijsmateriaal in rechtszaken: 'Onze technologie werpt vragen op over de validiteit van zulk bewijsmateriaal, omdat die het eenvoudig maakt geluidsopnamen te manipuleren. Dat kan gevaarlijke consequenties hebben.'

Moeten we voortaan elk filmpje wantrouwen dat voorbijkomt op YouTube en Facebook? In elk geval wel als we Klaver zien pleiten voor de privatisering van het onderwijs.

Kat-en-muisspel

Hoogleraar informatica en recht Jaap van den Herik pleit voor meer verantwoordelijkheid voor wetenschappers die technologieën ontwikkelen: zij zouden al rekening moeten houden met mogelijk misbruik. 'Je kunt nieuwe camera's uitrusten met technologie om filmmateriaal te watermerken: zo wordt manipulatie zichtbaar. Maar ja, er zullen altijd criminelen zijn die daarop weer iets verzinnen. Het blijft een kat-en-muisspel.'

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 de Persgroep Nederland B.V. - alle rechten voorbehouden