Gedrag duiden op basis van sociale media zit vol valkuilen

Veel wetenschappers duiden gedrag van bevolkingsgroepen op basis van sociale media. Maar de valkuilen zijn legio, stellen onderzoekers in Science.

Jongerenprotest in Hongkong. Het is sterk de vraag of gebruikers van sociale media een afspiegeling zijn van de bevolking. Beeld getty

Het leek het ei van Columbus: zoekopdrachten naar griep kunnen epidemieën beter voorspellen dan op basis van officiële cijfers mogelijk is. In 2009 wist Google Flu Trends een uitbraak van H1N1 in de Verenigde Staten twee weken eerder te voorspellen dan de instanties.

Mooi nieuws. Alleen bleek na verloop van tijd dat Google Flu de hoeveelheid griepgevallen flink begon te overschatten, tot soms wel 95 procent.

Het is verleidelijk data afkomstig van sociale media te gebruiken bij onderzoek. Maar de valkuilen van dit digitale veldwerk zijn talrijk en wetenschappers moeten daarmee beter rekening houden, aldus een studie in Science. 'Data afkomstig uit sociale media kunnen helpen bij het accuraat voorspellen van menselijk gedrag op grote schaal', zegt een van de auteurs, computerwetenschapper Derek Ruths van de Canadese McGill universiteit. 'Daarvoor bestaan sterke aanwijzingen.'

Dan moet het wel goed gebeuren. Gebruikers van sociale media zijn dikwijls geen afspiegeling van de bevolking. Zo zitten op Instagram in Noord-Amerika relatief veel gebruikers in de leeftijd van 18 tot 29, vrouwen, Afro-Amerikanen, latino's en stedelingen. Pinterest is 'dichtbevolkt' met vrouwen van 25 tot 34 met een hoog inkomen. Voor deze afwijkingen wordt zelden gecorrigeerd, aldus de onderzoekers.

Ongefilterd

Andere valkuilen: data die publiekelijk worden gedeeld door de sociale media zelf zijn geregeld gefilterd en daardoor niet eens een accurate weergave van de gebruikerssamenstelling. Ook posten op sociale media vaak hele volksstammen spammers en bots (robots die automatisch gegenereerde berichten sturen), en hun data gaan geregeld ongefilterd mee in de resultaten.

Ruths wil geen voorbeelden geven van publicaties waarin het mis ging. 'Ik wil liever niet met een beschuldigende vinger wijzen.' Er moet alleen meer aandacht komen voor de zwakke plekken. Onderzoekers die data van sociale media analyseren, pionieren in veel opzichten met nieuwe technieken, aldus Ruths. 'Dat daarbij fouten worden gemaakt is noodzakelijk. Dat is het hele idee van wetenschappelijk onderzoek: laten zien wat er misgaat, zodat iedereen ervan kan leren.'

Google heeft zijn algoritme aangepast en maakt ook gebruik van andere bronnen om voorspellingen te kunnen doen. Het concern wil zijn zoekmethoden niet delen met onafhankelijke onderzoekers. 'We zouden dat graag doen, maar dan kan iedereen ons spelletje kopiëren', aldus softwareontwikkelaar Christian Stefansen drie weken geleden in de Tech Times.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden