Het WK voetbal nadert zijn ontknoping. De laatste wedstrijd moet nog worden gespeeld, maar inmiddels is al duidelijk dat dit WK een aantal verrassende momenten kent, zoals de Saoedische winst op Argentinië en de Koreaanse winst op Portugal. Maar verrassingen zijn geen verrassing: met een WK van 64 wedstrijden zou het juist verrassend zijn als elke keer het meest waarschijnlijke team wint.

Hoe groot is de kans dat het beste team daadwerkelijk kampioen wordt op het WK? Dat is erg lastig – en eigenlijk gewoon onmogelijk – om te berekenen. Voorafgaand aan het WK hebben meerdere partijen via ingewikkelde modellen voorspellingen gedaan. Deze worden bijvoorbeeld gebruikt door wedkantoren om zo efficiënt mogelijk geld te verdienen aan gokverslaafden.

Al deze modellen komen met ietwat andere voorspellingen maar zijn het in grote lijnen eens. Zo was Brazilië vooraf de titelfavoriet. Dat klinkt echter veel positiever dan het is: de titelkans was volgens een model 20,9 procent, dus de kans dat Brazilië niet wint is ongeveer vier keer zo groot. Met de kennis van nu lijkt dat model dus beter te zijn.

Deze modellen zijn veelal een soort black box: je weet niet welke data zijn gebruikt en hoe de modelleurs tot hun voorspellingen komen. Al die modellen nemen tal van mogelijk relevante variabelen mee: hoeveel zijn de spelers waard op de transfermarkt, wat is de Fifa-ranking van het land, de lengte van de keeper, enz. Vervolgens wordt een ingewikkeld model gebouwd en gevalideerd op de resultaten van een vorig kampioenschap. Uiteindelijk worden er iets van honderdduizend simulaties gedraaid en wat magische getallen tevoorschijn getoverd.

Honderdduizend simulaties klinkt veel en dus klinken de antwoorden betrouwbaar. Echter, dit is nog steeds niet genoeg om de complexiteit van het WK echt te vangen. Alleen al in de groepsfase zijn er 48 wedstrijden, elk met drie mogelijke uitkomsten: gelijkspel, of winst voor een van de twee teams. In totaal zijn er dan 48 tot de macht drie mogelijkheden, en dit zijn er al meer dan honderdduizend (110.592 om precies te zijn). En dan hebben we het nog niet eens over zaken als doelsaldo gehad.

Zelfs teams hoog op de ranking lopen het risico de knock-outfase te missen, zoals onze ooster- en zuiderburen weten. Vanaf de knock-outfase moet je vier keer op rij winnen om kampioen te zijn. Nog los van de risico’s om in de groepsfase te sneuvelen, moet je bij alle vier die wedstrijden een kans van zo’n 68 procent op de winst hebben om uiteindelijk op die 20,9 procent winstkans van Brazilië te halen. Gegeven dat je tegen de besten van de wereld speelt, is dat een behoorlijk grote kans.

Een laatste nadeel van al dit soort modellen: het is erg lastig nagaan of ze echt werken. Als we het WK honderd keer achter elkaar laten spelen en Brazilië wint rond 21 keer daarvan, dan ondersteunt dat de modelberekeningen mooi. Maar met maar één WK – wat niet door Brazilië gewonnen wordt – kan dit niet. Per saldo zegt die 20,9 procent niet veel meer of minder dan dat Brazilië kampioen kan worden, maar dat het waarschijnlijker is dat ze dat niet worden. In die context heeft zo’n model het altijd voor 47 van de 48 landen goed. Knap hoor.

Casper Albers is hoogleraar statistiek aan de Rijksuniversiteit Groningen