Beeld Rein Janssen

Het plan is onderzoek te doen naar biefstukken. Preciezer: wat de gedachte aan een grote, rode lap vlees teweegbrengt bij mensen. Het is mei 2011 en het lijkt erop dat Diederik Stapel en Marcel Zeelenberg voor het eerst sinds jaren weer gaan samenwerken.

Wat de twee hoogleraren psychologie dan nog niet weten, is dat hun onderzoek er nooit zal komen, dat het desalniettemin onderdeel zal worden van een enorme fraudezaak die de wereldpers haalt en dat die fraudezaak het beginpunt zal zijn van een diepe crisis in hun vakgebied.

Stapel en Zeelenberg zijn goede vrienden. Ze kennen elkaar sinds de jaren negentig, toen ze allebei als jonge onderzoekers aan de Universiteit van Amsterdam werkten. Nadat Zeelenberg hoogleraar was geworden in Tilburg, haalde hij Stapel daar in 2006 binnen. Als academicus kijkt hij in die tijd op tegen Stapel, vertelt hij in zijn met boeken en paperassen bezaaide werkkamer aan de Universiteit Tilburg. Als vriend kan hij bij hem terecht als hij niet lang daarna in scheiding komt te liggen. ‘We waren heel close, in mijn beleving’.

Van samen onderzoek doen is het in al die jaren nauwelijks gekomen. Nu liggen er concrete plannen. De Nijmeegse hoogleraar Roos Vonk doet ook mee. Zeelenberg: ‘Zij had Stapel benaderd om samen onderzoek te doen. ‘Jij moet meedoen’, zei Diederik tegen mij. ‘Dat is lachen.’’

Na een brainstormsessie besluiten Stapel, Zeelenberg en Vonk onder andere te gaan onderzoeken of de gedachte aan een grote, rode biefstuk mensen egoïstischer maakt. Het plan is gebaseerd op de in die tijd populaire theorie binnen de sociale psychologie dat de gedachte aan geld mensen zelfzuchtiger maakt.

Stapel, die een sterrenstatus heeft verworven als hoogleraar die altijd met mediagenieke resultaten komt, gaat de data verzamelen. Als Zeelenberg een poosje later op vakantie is, krijgt hij een mailtje. ‘Diederik schreef ons dat hij het onderzoek gedraaid had. Sommige dingen kwamen mooi uit, andere wat minder. We zouden er na de vakantie over doorpraten.’

Tot een publicatie komt het niet, want in de tussentijd wordt bekend dat Stapel jarenlang fraude heeft gepleegd. Dat beperkte zich niet tot in het geniep prutsen aan cijfers. Hij claimde bijvoorbeeld dat hij op een middelbare school onderzoek had gedaan, maar in werkelijkheid vulde hij de vragenlijsten zelf in. Moesten proefpersonen tijdens een experiment M&M’s eten, dan at hij die zelf op.

Ook het onderzoek naar vleesconsumptie heeft hij uit zijn duim gezogen, zonder dat zijn collega’s daarvan afwisten. Vonk krijgt desondanks een berisping, want voordat de fraude bekend werd, stuurde ze samen met Stapel een ronkend persbericht rond over het ‘onderzoek’, zonder dat ze de (verzonnen) onderzoeksgegevens had gezien. Zeelenberg wordt gehoord door de commissie-Levelt, die de fraudezaak onderzoekt.

Dagelijkse praktijk

Ruim een jaar nadat het bedrog is uitgekomen, presenteert de onderzoekscommissie een vernietigend rapport. Stapel pleegde fraude in maar liefst 55 publicaties. En toch is dat is niet de belangrijkste conclusie van het onderzoek, aldus commissievoorzitter Pim Levelt. Dat is de onverwachte ‘bijvangst’ van zijn onderzoek: het gerommel en gesjoemel dat dagelijkse praktijk blijkt in de wetenschap.

Onderzoekers die een experiment net zo lang herhalen tot er iets spannends uitkomt. Gerenommeerde vakbladen die auteurs aanraden om ongunstige onderzoeksuitkomsten te schrappen. Ervaren wetenschappers die statistische basisbeginselen niet lijken te begrijpen. Levelt verzon er zelfs een woord voor: ‘slodderwetenschap’.

Het is maandag op de kop af tien jaar geleden dat de commissie-Levelt haar snoeiharde onderzoeksrapport Falende wetenschap presenteerde. Het moest allemaal anders, concludeerden veel psychologen destijds, degelijker, betrouwbaarder.

Wat is er terechtgekomen van die goede voornemens? Kan een fraudeur nu nog jarenlang ongehinderd zijn gang gaan, zoals Stapel indertijd? En belangrijker: wordt er nog evenveel gerommeld?

In de werkkamer van Marcel Zeelenberg luidt het antwoordt: ja en nee. Nee, want veel wetenschappers hebben hun onderzoekspraktijk flink verbeterd, ziet de hoogleraar. Daar is hij zelf een voorbeeld van – waarover later meer. Maar ook ja: want wie wil, kan nog steeds frauderen, zegt Zeelenberg. Die les heeft hij inmiddels geleerd.

Had je hem voor de fraude naar buiten kwam gevraagd: voor wie steek je je hand in het vuur, zegt de hoogleraar, nog altijd hoorbaar geëmotioneerd, dan had hij Stapel gezegd. ‘Ik vond hem een slimme, betrouwbare, warme man.’

Eenmaal bekomen van de schok dacht Zeelenberg in eerste instantie dat hier sprake was van een uitzonderlijke gebeurtenis. ‘Maar in de jaren erna bleek dat meer mensen fraudeerden, ook in Nederland.’ Aan deze vorm van fraude valt weinig te doen, zegt de hoogleraar. ‘Je kunt niet alles controleren, niet continu over iemands schouder meekijken.’ Dat is een breder gedeeld sentiment in de wetenschap. Universiteiten en wetenschappelijke tijdschriften kunnen nog zo veel regels en controlesystemen optuigen, wie echt wil kan de boel belazeren.

Beeld Rein Janssen

Ook de consensus: aan slodderwetenschap valt wel iets te doen. Zeelenberg: ‘We zijn jarenlang veel slordiger geweest dan nodig.’ Zelf maakte hij zich daar ook schuldig aan, erkent de hoogleraar. Dat ging bijvoorbeeld zo. ‘Je deed een bepaald experiment met honderd proefpersonen en als de resultaten de goede kant op gingen en de verschillen bijna significant waren, draaide je nog een stuk of veertig proefpersonen extra. Als het dan statistisch significant was, ging je daarmee aan de slag.’

Dat deze werkwijze resultaten opleverde die op papier betrouwbaar leken maar het in de praktijk niet waren, ‘daar stonden we niet bij stil’. Het was de manier waarop de dingen toen gingen, zegt Zeelenberg. ‘Zo leerde je het als jonge onderzoeker. En als je niet weet dat je iets fout doet, valt er niets te verbeteren.’

Goochelen met cijfers

De commissie-Levelt stuitte op vele varianten van vergelijkbaar gegoochel met cijfers. Dat was niet alleen een Nederlands probleem. Uit onderzoek dat rond diezelfde tijd verscheen, bleek slodderwetenschap ook onder Amerikaanse psychologen aan de orde van de dag. Bijna 80 procent van de ondervraagde onderzoekers zei resultaten die niet goed uitkomen achter te houden. Ruim de helft stelde naar eigen zeggen achteraf zijn hypothese bij, zodat het leek alsof de uitkomst mooi aansloot bij de theorie.

Wie wil afvallen moet van kleinere borden eten. Het lezen van fictie leidt tot meer empathie. Herinner iemand aan de tien geboden en prompt gaat hij zich eerlijker gedragen. In het tijdperk dat aanbrak ‘na Stapel’ kwam de ene na de andere beroemde psychologische vondst op losse schroeven te staan. Soms omdat er sprake was van fraude, vaker omdat het effect bij het nauwgezet herhalen van het bewuste experiment niet bleek op te treden, om uiteenlopende redenen. De zogenoemde replicatiecrisis was geboren.

De sociale psychologie was lange tijd een ‘leuke freakshow van geinige effecten’, zegt Zeelenberg, ‘maar veel van die geinige effecten blijken niet waar te zijn.’ De realiteit, zegt de hoogleraar, ‘is een stuk saaier dan wij een tijdlang gedacht hebben’.

Ter nuance: fraude en slodderwetenschap zijn niet voorbehouden aan de sociale psychologie. Ook in andere wetenschapstakken leveren onderzoeken als ze herhaald worden vaak heel andere resultaten op.

Grote stappen

Zeelenberg klapt zijn laptop open om te laten zien hoe hij en veel van zijn collega’s nu onderzoek doen. Een belangrijke verandering is dat hij nu al zijn onderzoeksgegevens standaard openbaar maakt, zodat collega’s makkelijk kunnen nagaan hoe hij te werk is gegaan.

Bovendien legt de hoogleraar zijn plannen vast voordat hij onderzoek gaat doen. Ook deze ‘pre-registratie’, in jargon, maakt hij openbaar. Het is een belangrijk controlemechanisme: door vooraf tot in detail vast te leggen hoe een onderzoek eruit gaat zien, kan een onderzoeker achteraf niet meer zomaar proefpersonen uit het experiment gooien of de hypothese bijschaven om de resultaten mooier te maken.

Deze werkwijze is niet voorbehouden aan de braafste jongetjes van de klas, vertelt Brian Nosek, hoogleraar psychologie, via een videoverbinding vanuit Virginia. Nosek is de initiatiefnemer van een aantal grootschalige replicatieprojecten, waarbij honderden prominente onderzoeken herhaald werden. Ook is hij oprichter van het Center for Open Science, dat zich inzet voor degelijke wetenschap. Daar is vorig jaar een onderzoek begonnen onder wetenschappers. Hoe kijken ze naar het gebruik van data en andere methoden die hun werk betrouwbaarder moeten maken?

Uit de eerste, nog voorlopige, resultaten blijkt dat de meerderheid (zo’n 60 procent) van de ondervraagde psychologen in hun recentste onderzoek data hebben gedeeld. Zo’n 40 procent registreerde het onderzoek vooraf. Nosek: ‘Tien jaar geleden deed niemand dat nog.’

De psychologie is hard aan het verbeteren en Nederland loopt voorop, zegt de Amerikaanse hoogleraar. Misschien juist door het Stapel-schandaal zijn hier de grootste stappen gezet. Belangrijke wetenschapsfinanciers als NWO en ZonMw stelden geld beschikbaar voor replicatieonderzoek. Aan de Universiteit Tilburg verrees het Meta-Research Center, dat onderzoekt hoe psychologen beter onderzoek kunnen doen. ‘Mensen als Michèle Nuijten doen daar fantastisch werk.’

‘Spellingcheck’ voor statistiek

Niet iedereen deelt het enthousiasme over haar werk, vertelt Nuijten zelf vanuit de ruime werkkamer in Tilburg die ze met een collega deelt. Nuijten is universitair docent methodologie en werd bekend in de wetenschapswereld met Statcheck, een soort spellingchecker voor statistiek, die ze samen met een collega-onderzoeker ontwikkelde.

Toen ze Statcheck losliet op 30 duizend artikelen was de uitkomst ontnuchterend. In een op de acht papers bleek sprake van grove onzorgvuldigheden in het cijferwerk, met gevolgen voor de gerapporteerde statistische uitkomsten. Toen een collega nog eens 50 duizend artikelen door Statcheck haalde en de resultaten openbaar maakte, volgden woedende reacties. ‘Methodologisch terrorisme’, foeterde een prominente Amerikaanse hoogleraar psychologie.

De gemoederen onder wetenschappers waren een tijdlang behoorlijk verhit, zegt Nuijten. ‘Mensen waren bang: als ik ook maar één typfout maak, word ik opgeknoopt aan de hoogste boom.’ Inmiddels is de sfeer gekalmeerd en staat de psychologie er beter voor, zegt Nuijten. Dat gebeurt in grote stappen – zoals onderzoeksfinanciers die bij het toekennen van beurzen nu meewegen in hoeverre wetenschappers hun data delen – maar ook in ogenschijnlijk kleine.

Zo is vakblad Psychological Science wetenschappers die hun data openbaar maken een paar jaar geleden gaan belonen met een ‘badge’ op hun publicatie: een soort stempel op de beginpagina van het artikel dat in één oogopslag duidelijk maakt dat de data openbaar zijn. Dit wetenschappelijke equivalent van een sticker op een goed gelukt schoolwerkje mag kinderachtig lijken, zegt Nuijten, maar in het jaar nadat Psychological Science ermee was begonnen, steeg het aandeel opendatapublicaties van 3 naar 39 procent.

De grenzen van het toelaatbare

Minder hoopgevende cijfers zijn er ook. Want alle verbeteringen ten spijt: ruim de helft van de wetenschappers in Nederland zoekt naar eigen zeggen nog altijd regelmatig de grenzen van het toelaatbare op. Een op de twaalf heeft de afgelopen drie jaar zelfs weleens onderzoeksresultaten verzonnen of aangepast. Dat bleek vorig jaar uit de Nationale Onderzoeksintegriteitsenquête, het grootste onderzoek dat wereldwijd naar dit onderwerp is gedaan.

Nuijten kijkt er niet van op. ‘We kunnen in tien jaar tijd niet een wetenschappelijke cultuur veranderen die de afgelopen honderd jaar is ontstaan.’

De wetenschap is nog altijd een wereld van schaarse middelen, hoge werkdruk en een overvloed aan jonge onderzoekers die een plekje proberen te veroveren. Academici worden uiteindelijk afgerekend op de hoeveelheid publicaties die ze eruit weten te slepen. Nederlandse universiteiten willen daar wel iets aan doen. Het plan is om beoordelingen bijvoorbeeld ook te baseren op andere taken van wetenschappers, zoals onderwijs, maar dat is een proces van de lange adem.

Diederik Stapel was op zoek naar esthetiek, niet naar de waarheid, zei hij achteraf over zijn fraude. Heldere resultaten die een goed verhaal vertelden. Een tot op zekere hoogte vergelijkbaar mechanisme speelde lange tijd bij wetenschappelijke tijdschriften. Redacteuren en reviewers, die kritisch moeten meelezen, waren op zoek naar een mooie verhaallijn. Dat resulteerde erin dat onderzoekers weleens werd verzocht onwelgevallige resultaten weg te laten omdat dat beter ‘in de lijn van het verhaal past’, aldus de commissie-Levelt.

Herkenbaar, vindt Colin Leach, redacteur van een van de prominentste vakbladen in de sociale psychologie, Journal of Personality and Social Psychology. ‘Er is een generatie wetenschappers die geleerd heeft dat de narratieve lijn het belangrijkst is.’

Ook in zijn vakblad verschenen een aantal frauduleuze studies van Stapel. ‘We hadden toen ook al procedures en codes om dit te voorkomen, maar in de praktijk werden ze niet toegepast. Ze pasten niet bij de heersende norm.’ Inmiddels is die heersende norm kritischer en zijn de regels rondom publicaties explicieter, zegt Leach.

Nieuwe initiatieven

In Tilburg zakt bij methodoloog Michèle Nuijten de moed weleens in de schoenen. ‘Dan lees ik bijvoorbeeld een onderzoek waaruit blijkt dat publicaties met de meest flitsende bevindingen nog altijd het meest geciteerd worden.’ Maar tegenover elk onderzoek dat benadrukt hoe belabberd de boel ervoor staat, ziet Nuijten tien nieuwe initiatieven die de wetenschap beter proberen te maken. ‘Dit klinkt misschien een beetje kumbaya, maar het is ook een keuze om erin te geloven dat het beter kan worden.’

Stapel werd ontslagen nadat de fraude was uitgekomen. Hij leverde vrijwillig zijn doctorstitel in en schreef een boek over zijn fraude. Nu helpt hij als coach ‘mensen, bedrijven en organisaties met gedrags- en systeemverandering’, valt op zijn website te lezen. Stapel wilde de Volkskrant niet te woord staan.

Marcel Zeelenberg kan verdrietig worden als hij terugdenkt aan het enthousiaste mailtje dat Stapel hem destijds schreef over hun ‘onderzoek’ naar vleesconsumptie. ‘Ik heb die mail nog steeds. Als je ’m nu terugleest, zie je pas hoe slim hij ons belazerde.’

Nee, vrienden zijn Stapel en hij niet meer. Als de hele affaire Zeelenberg iets heeft opgeleverd, is het dat hij minder naïef is. ‘Als ik vijftien jaar geleden over een spectaculair nieuw onderzoek las, dacht ik: supergaaf, dat had ik nooit gedacht. Nu denk ik in zo’n geval: volgens mij kan dat helemaal niet.’ Hij is er een betere wetenschapper door geworden, zegt hij. ‘Dat hoop ik, althans.’

Beeld Getty / iStockphoto