Vaccineren werkt. Dat blijkt wel weer uit de recente RIVM-cijfers: van alle ziekenhuisopnames gaat het in 75 procent van de gevallen om personen die niet (volledig) gevaccineerd zijn. Bij ic-opnames gaat het zelfs om 84 procent.

Het doel van statistiek is om ingewikkelde data samen te vatten in een of enkele zinvolle getallen. En die 75 procent en 84 procent hierboven zijn zeker zinvol: als maar een van de vier opnames een gevaccineerd persoon is, dan doen die vaccins dus duidelijk iets goed.

Maar die 75 procent geeft ook een vertekend beeld. Het wekt de indruk dat een gevaccineerde drie keer zo goed beschermd is dan een ongevaccineerde. Dat is natuurlijk niet zo: er zijn inmiddels veel meer gevaccineerden (83,5 procent) dan ongevaccineerden (16,5 procent). Die 83,5 procent vullen dus een kwart van de ziekenhuisbedden. Daarmee hebben niet-gevaccineerden niet een drie keer zo hoog risico op ziekenhuisopname, maar ruim vijftien keer zo hoog. En wat ic-opnames betreft zelfs 26,5 keer zo hoog.

En daar houdt de vergelijking niet eens op. Coronapatiënten die op de ic belanden, liggen daar gemiddeld veel langer dan andere ic-patiënten: ruim tien dagen tegenover een dag of twee. De capaciteit om iemand met corona op de ic te verzorgen, gaat dus ten koste van zo’n vijf andere operaties; hierdoor is die factor 26,5 dus zelfs nog een enorme onderschatting. Op basis van tot dan toe bekende gegevens, kwam het RIVM in augustus zelfs op een factor 33.

Kortom: die 75 procent en 84 procent geven een nuttige samenvatting van de onderliggende data, maar geven tegelijkertijd onvoldoende informatie. Om een goed beeld te vormen is extra context nodig.

Maar zelfs als een enkel getal wel voldoende is – bijvoorbeeld de dagelijkse besmettingen per gemeente – gaat het soms mis bij de interpretatie. De dagelijkse besmettingscijfers geven we niet in absolute getallen, omdat dat weinig zinvol is: zo heeft Amsterdam momenteel zo’n drie keer zoveel besmettingen als Staphorst, maar ook vijftig keer zoveel inwoners.

We drukken besmettingen uit in relatieve getallen. Omdat het bij percentages nog steeds om kleine waarden gaat (0,2 procent per week voor Staphorst) werken we met aantallen besmettingen per 100.000 inwoners. Staphorst zit boven de 2000 besmettingen per 100.000 inwoners per week, Amsterdam rond de 130. Volgens Pieter Borger, ooit gepromoveerd in de genetica, maar nu actief als influencer onder de coronasceptici, is zo’n weergave ‘statistisch bedrog’: Staphorst heeft maar 17 duizend inwoners, dus spreken van 100.000 inwoners zou misleidend zijn.

Dat is onzin natuurlijk: aan getallen op dezelfde schaal weergeven is niks misleidends. Sterker nog, dit is juist de beste manier om dergelijke informatie te geven. De Duitse psycholoog en statisticus Gerd Girerenzer heeft uitgebreid studie gedaan hoe je het beste dergelijke getallen kan communiceren. Daaruit blijkt juist dat zogenaamde natuurlijke frequenties zoals ‘tweeduizend per honderdduizend’ veel beter begrepen worden dan abstracte kansen als 0,002 (ook al zeggen beide exact hetzelfde).

Dus zelfs als de informatie op de beste manier wordt gecommuniceerd, blijft interpretatie lastig. Dat benadrukt maar weer eens het belang van goede (corona)communicatie. Het is inmiddels volstrekt onhelder waar op de routekaart we ons bevinden en vrijblijvende adviezen als ‘je mag best thuiswerken, maar het hoeft niet’ zijn evident niet effectief. Goede communicatie en uitleg kan nieuwe, zwaardere maatregelen helpen voorkomen. Maar dan moet de overheid die handschoen wel oppakken: alleen samen krijgen we corona onder controle.

Casper Albers is hoogleraar statistiek aan de Rijksuniversiteit Groningen.