Griepgolf of effectenhandel: sociale media voorspellen ze

Waarom zou je als socioloog of psycholoog nog enquêtes houden? De hele wereld zet zijn zieleroerselen immers op internet.

Een reclame voor Facebook in New York Beeld reuters
Een reclame voor Facebook in New YorkBeeld reuters

Het blijft een beeld dat de sociale psychologie tot in lengte van dagen zal blijven achtervolgen: Diederik Stapel, de sjoemelende hoogleraar, die in zijn auto zakjes met M&M's leeg eet die hij had gekocht voor proefpersonen aan een experiment dat hij niet zou uitvoeren. Stapel beschreef het tafereel in zijn vorige week verschenen boek.

Altijd onderweg - dat is het lot van de menswetenschapper. Hij moet de paden op, de lanen in, om zijn onderzoeksobjecten het hemd van het lijf te vragen. Of het nu gaat om het welzijn van het individu of het humeur van een heel land - met interviews en enquêtes moeten de psycholoog en de socioloog de waarheid boven water krijgen.
Maar het kan ook anders.

Proefpersonen
Cameron Marlow, socioloog in Californië, hoeft de deur niet uit en laat zelfs de telefoon op de haak. Toch kan hij beschikken over een panel van maar liefst een miljard proefpersonen. Die verblijven binnen en buiten de Verenigde Staten, en wat helemaal geweldig is: in veel gevallen hebben ze hun hele hebben en houden al voor Marlow geopenbaard. Zonder dat de onderzoeker ze daarom hoeft te vragen.

Marlow staat aan het hoofd van het Data Science Team van Facebook, het grootste sociale netwerk op internet. Technology Review, het huisorgaan van het Massachusetts Institute of Technology (MIT), omschreef de twaalfkoppige onderzoeksgroep afgelopen zomer als 'een soort van Bell Labs in het tijdperk van de sociale netwerken'. De Bell-laboratoria van het telefoonbedrijf AT&T vormden decennia lang een van de belangrijkste broedkamers voor nieuwe technologie.
Marlow en zijn mannen vinden geen laserlicht uit of een nieuwe transistor. Ze passen wiskunde, programmeerkennis en sociale wetenschap toe om nieuwe inzichten te verkrijgen uit de zee van gegevens die in Facebook staat opgeslagen.

Nationaal Geluk
Al twee jaar geleden, toen het Data Science Team net was geformeerd, zetten de onderzoekers de index van Algemeen Nationaal Geluk online. Het is een barometer waaraan het welbevinden van een land is af te lezen. De index wordt voortdurend berekend op basis van de verhouding tussen positieve en negatieve woorden die bezoekers gebruiken.

Facebook blijkt niet de enige onlinebron voor wetenschappelijk speurwerk. In 2010 werden niet één maar twee nieuwe instrumenten geïntroduceerd om de verspreiding van griep in kaart te brengen. Zoekmachine Google had ontdekt dat bepaalde zoektermen een goede indicatie zijn voor hoe snel een influenzavirus om zich heen grijpt. Het internetbedrijf bracht Grieptrends uit, een pagina waarop de griepactiviteit op elk moment kan worden bekeken.

Tweets
Een tweede bruikbare griepmeter bleek verborgen in Twitter. Onderzoekers van de Southeastern Louisiana University analyseerden een half miljard tweets en konden zo de verspreiding van het griepvirus achterhalen en zelfs voorspellen. 'Deze benadering is goedkoper en sneller dan duizenden ziekenhuizen en medische centra elke week formulieren te laten invullen', zegt computerwetenschapper Aron Culotta. De bevindingen van zijn onderzoeksgroep kwamen voor 95 procent overeen met de landelijke statistieken van de Center for Disease Control (CDC).

Onderzoekers van Johns Hopkins Hospital noemden begin dit jaar in een studie de griepbarometer van Google 'een krachtig, vroegtijdig alarmsysteem' voor ziekenhuizen. Die conclusie trokken de wetenschappers nadat zij 21 maanden lang de grieptrends van de zoekmachine langs de statistieken van hun ziekenhuis in Baltimore hadden gelegd.

Effectenhandel
Twitterberichten blijken ook een goede graadmeter voor het voorspellen van de effectenhandel. Onderzoekers van de Indiana University joegen 9,8 miljoen berichten van 2,7 miljoen microbloggers door de computer om te zien of er een verband was tussen de stemming van het publiek en de slotwaarden van de Dow Jones Index.
Zie daar: over een periode van tien maanden bleek de software het beurssentiment in 87,6 procent van de gevallen juist te beoordelen - drie tot vier dagen voor de 'Dow' daalde of steeg. 'Dat was verrassend, omdat we dachten dat de stemming de index zou volgen - namelijk dat als de Dow stijgt mensen blij zijn, en als de index daalt, de mensen droef', zegt Johan Bollen, universitair hoofddocent.

Niet elke poging tot datamining - het doorploegen van bergen aan gegevens op zoek naar patronen - leidt tot klinkende resultaten. In 2010 dachten Sitaram Asur en Bernardo Huberman van HP Labs in Palo Alto dat ze aan de hand van tweets konden voorspellen of een film in de bioscoop zou aanslaan of floppen.

Filmbazen
Hun studie werd eerder dit jaar gekielhaald door twee onderzoekers van Princeton University. Zij toonden aan dat filmbazen zich maar niet moesten blindstaren op de jubel of de toorn van de twitterati. Zo blijken de microbloggers een film vaker gunstig dan ongunstig te beoordelen. Een baaierd aan loftuitingen blijkt lang niet steevast tot uiting te komen in meer verkochte kaartjes aan de bioscoopkassa.

Niettemin zien wetenschappers wel brood in dit nieuwe onderzoeksinstrument. 'Het heeft op papier veel potentie in zich om sociale bewegingen te kunnen volgen', zegt Vincent Buskens, hoogleraar theoretische sociologie aan de Universiteit Utrecht. Er komt volgens hem wel veel kijken bij het ontrafelen van gegevens uit sociale netwerken. 'Je krijgt het niet zomaar op je bordje. Je moet bedrijven zo ver krijgen dat ze de gegevens afstaan. Het gaat om grote hoeveelheden data, die een speciale software en hardware vereisen om te ontsluiten. Die is kostbaar.'

Een ander probleem is de vraag of je met Facebook of Twitter een goede dwarsdoorsnede hebt van een land, een bevolking of zelfs maar een afgeperkt deel van de populatie. 'Bij Facebook kun je je nog het best richten op een specifieke groep mensen', vindt Buskens. 'Bij Twitter weet je nog slechter wie er achter al die berichten zit.'

Bij het Sociaal en Cultureel Planbureau (SCP) in Den Haag, dat sinds 1994 namens de regering constant de polsslag meet van Nederland, zijn de sociale media wel ontdekt als studieobject, maar nog niet als onderzoeksbron. 'We werken nog vrij traditioneel met voornamelijk enquêtes onder de bevolking', meldt Jos de Haan, hoofd van de afdeling Tijd, Media & Cultuur. 'Voor zover ik weet is er nog nooit een SCP-rapport gepubliceerd dat gebaseerd was op datamining via internet.'

Aanvulling
De Haan staat niet afwijzend tegenover wat 'een nuttige aanvulling' kan zijn op andere meetmethoden. 'Al moet het praktische nut nog blijken.' Een georganiseerde discussie over internet als onderzoeksbron is volgens hem nog niet gevoerd bij het SCP.
Het Data Science Team van Cameron Marlow in Californië probeert er tot nu toe vooral achter te komen hoe relaties binnen Facebook werken . Zoals een bioloog een stok steekt in een mierennest om te zien hoe de beestjes reageren, zo experimenteren de wetenschappers met de reacties van een miljard gebruikers. Marlow en twee externe geleerden besloten bijvoorbeeld vorig jaar na te gaan wat er klopt van de gangbare sociologische theorie dat aanstekelijke nieuwe ideeën zich verspreiden als een besmettelijke ziekte: hoe meer mensen om ons heen eraan doen, des te groter de kans dat we zelf aanhaken.

De onderzoekers onthielden een kwart miljard gebruikers de verwijzingen die vrienden op hun profielpagina deelden - 219 miljoen aanbevelingen gingen zo de mist in. Zo konden ze nagaan hoe vaak mensen dezelfde informatie aanprijzen omdat ze dezelfde interesses en informatie hebben. Uit de studie bleek dat gebruikers de aanprijzingen van vrienden en bekenden hogelijk waarderen, maar dat hun invloed veel kleiner is dan de collectieve inbreng van contacten die veel verder van hen afstaan - wat sociologen de 'zwakke banden' noemen. Die zwakke banden bepalen veel sterker welke informatie we tot ons nemen.

Het is niet zo gek dat een amper acht jaar oud bedrijf een groep academici loslaat op zijn kroonjuwelen, zegt Marlow in Technology Review. 'Facebook staat voor de zelfde grote uitdagingen als de sociale wetenschap.' Met één verschil: Facebook, met een omzet van 2,84 miljard euro, kan zich heel wat gesuikerde chocolaatjes veroorloven.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden