Casper Albers

De modelmakers claimen altijd hun gelijk, ze wisten al dat Frankrijk eruit zou vliegen

null Beeld

Het EK voetbal is in volle gang, maar wordt het beste team ook kampioen? Waarschijnlijk niet. Het beste team heeft weliswaar de beste papieren, maar garanties zijn er niet. En dat is maar goed ook: als de uitslag vooraf al te berekenen is, is het een stuk minder leuk om de wedstrijd te kijken. En niet alles is te modelleren. Als Arjen Robben in de 62ste minuut van de WK-finale 2010 de bal nét wat beter voor de voet gekregen had, was Oranje wereldkampioen.

Stel, een van de acht overgebleven teams in de kwartfinales is beduidend beter dan de rest en heeft in alle drie de wedstrijden die gaan komen 75 procent kans om te winnen. Dan nog is de kans dat dit team kampioen wordt slechts 42 procent: ondanks de enorme overmacht is het waarschijnlijker dat dit team geen kampioen wordt.

Vorige maand kwam een onderzoek uitgebreid in de media: men had berekend dat Frankrijk de beste papieren had om kampioen te worden, 14,8 procent kans. Een ander model gaf Frankrijk zelfs 20,5 procent kans. Maar hoe weet je of zo’n model klopt?

Was Frankrijk kampioen geworden, dan hadden beide modelbouwers ‘zie je wel!’ kunnen roepen. Maar ook nu Frankrijk uitgeschakeld is, kunnen zij erop wijzen dat hun modellen dat al met 85,2 respectievelijk 79,5 procent zekerheid wisten. Wat er ook gebeurt, de modelmaker kan altijd het gelijk claimen.

De Franse topspeler Kylian Mbappé mist zijn strafschop, Zwitserland gaat door.  Beeld AFP
De Franse topspeler Kylian Mbappé mist zijn strafschop, Zwitserland gaat door.Beeld AFP

In 2015 stuurde een groep onderzoekers een dataset over voetbal, met gegevens van tientallen voetbalwedstrijden en duizenden voetballers, naar 29 onderzoeksteams. Elk onderzoeksteam werd gevraagd antwoord te geven op de vraag of spelers van kleur vaker een rode kaart kregen dan witte spelers.

Hoe modelleer je zoiets? Stop je de leeftijd of positie van een speler in het model? Definieer je huidskleur als zwart vs. wit of werk je met gradaties? Door tal van dit soort (subjectieve) keuzes in de analyses, kwamen alle teams op andere antwoorden. De bevindingen lagen ook ver uit elkaar: waar het ene team een donkere speler een dubbele kans op een rode kaart toedichtte, vond het andere team geen verschil.

Dit fenomeen – dat verschillende onderzoekers op basis van dezelfde data tot compleet andere antwoorden komen – is hierna vaker aangetoond, ook bij zaken die belangrijker zijn dan een potje voetbal. Dit is een van de redenen waarom de roep om open wetenschap – waarbij onderzoekers 100 procent transparant zijn over alle keuzen in het analyseplan – steeds sterker wordt.

Zonder die transparantie weet je niet op basis van welke onschuldige en/of bewuste keuzen men tot het antwoord gekomen is. Dat is ook de kritiek op Fieldlabs: uit ontransparant onderzoek vanuit de evenementenbranche zou blijken dat de evenementenbranche weer aan de slag kan. Dat gebrek aan openheid komt de betrouwbaarheid van de wetenschap niet ten goede.

Casper Albers is hoogleraar statistiek aan de Rijksuniversiteit Groningen

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden