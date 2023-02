Onlangs maakte ik een fout in een column: bij een rekensommetje gaf ik het antwoord 48 tot de macht 3, in plaats van 3 tot de macht 48. Klinkt als een detail, maar het ene is bijna een miljard miljard keer zo groot als het andere getal. Gelukkig stonden alle details die nodig waren om het antwoord te berekenen ook in de column, zodat oplettende lezers mij op de fout konden wijzen en het in de onlineversie van de column aangepast kon worden.

Ik ben niet de enige wetenschapper die weleens een fout maakt (helaas voor de samenleving, maar fijn voor mijzelf). Dit keer was de fout voor de lezer zichtbaar, maar doorgaans wordt in wetenschappelijke publicaties niet elke berekening en denkstap zodanig gedetailleerd uitgelegd dat deze kan worden gerepliceerd.

Bij fouten in de wetenschap wordt vaak gedacht aan Diederik Stapel en andere oplichters die opzettelijk de boel verdraaien om gewenste resultaten te verkrijgen. Uit onderzoek weten we echter dat minder dan 1 procent van de fouten opzettelijk gemaakt worden. De rest komt door onopzettelijk gemaakte fouten. En zo’n fout kan flinke gevolgen hebben. In 1999 stortte Nasa’s Mars Climate Orbiter neer omdat bij het ontwerpen iemand vergeten was iets te converteren van Engelse in metrische eenheden.

Een effectieve manier om de impact van dergelijke fouten te verkleinen, is open wetenschap. Als je volledig transparant bent – in de keuzen die je maakt over wat je wel en niet onderzoekt, in de data die je verzamelt en in de details over hoe je die data analyseert – kun je natuurlijk nog steeds fouten maken. Het grote voordeel is echter dat de oplettende lezer zo’n fout kan spotten, waarna deze kan worden hersteld.

Universiteiten hebben de afgelopen jaren al grote stappen richting open science gezet. Nationale onderzoeksinstituten volgen op enige afstand. Een van de grootste uitdagingen is het beschikbaar maken van de data: deze zijn vaker wel dan niet gevuld met privacygevoelige gegevens, en die mogen, terecht, niet zomaar geopenbaard worden.

Als het om iets relatief onbelangrijks gaat dan is dat geen probleem. Maar veel onderzoeken hebben wel enorme impact: denk aan de coronamodellen van het RIVM, het CBS-onderzoek naar de toeslagenaffaire, of het onderzoek van het Instituut Mijnbouwschade Groningen. Telkens zijn de data te privacygevoelig om zomaar te delen en moeten we maar hopen dat niemand in een corona- of aardbevingsmodel per ongeluk een foutje heeft gemaakt.

Door AVG-wetgeving is het nu vaak niet toegestaan om derden naar de data te laten kijken. De conclusies in rapporten kunnen dan dus niet goed gevalideerd worden door onafhankelijke derden, en alternatieve modellen kunnen niet worden gebruikt. Het zou goed zijn als hiervoor in de regelgeving rond privacygevoelige informatie een oplossing wordt gezocht. Zorg dat het mogelijk is dat wetenschappers een onafhankelijke blik op de data en de analyse kunnen werpen. Het CBS doet al veel op dit gebied, maar veel data liggen bij andere overheidsinstanties.

Als statisticus tussen de gedragswetenschappers werk ik dagelijks met privacygevoelige data. Hier zijn binnen de wetenschap al uitstekende (en ietwat bureaucratische) controlemechanismen voor die de dataveiligheid moeten garanderen. Dat zou binnen alle overheidsinstanties staande praktijk moeten zijn. Een betrouwbare overheid is een transparante overheid.

Casper Albers is hoogleraar statistiek aan de Rijksuniversiteit Groningen