Opinie

Zijn er systematische verschillen tussen scholen in hun scores op de rekentoets?

Rond rekenen en de rekentoets in het voortgezet onderwijs woedt een halve 'burgeroorlog'. Zijn de verschillen in rekenscores betekenisloos?

null Beeld anp
Beeld anp

Een van de argumenten was dat de rekentoets 2014 zo slecht geconstrueerd is dat de uiteindelijke score op toeval berustte. Ook zou de score op de rekentoets op toeval berusten, omdat leerlingen en leraren de afname niet serieus namen. Als deze argumenten correct zijn, zou de gemiddelde score op de rekentoets tussen scholen niet systematisch mogen variëren en zouden verschillen in rekenscores tussen onderwijstypen ook niet systematisch mogen zijn. In dit artikel ga ik na of de score op de rekentoets die alle eindexamenkandidaten in 2014 gemaakt hebben systematisch varieert tussen scholen en onderwijstypen. Dit artikel gaat dus niet over de vraag of de rekentoets rekenen valide meet, of wat onder rekenen verstaan moet worden.

Data
De data die ik gebruik zijn gepubliceerd door het ministerie van OC&W. Zij zijn beschikbaar als score per onderwijstype (VWO, HAVO, VMBOgt, VMBOk, VMBOb) en BRIN-nummer (indicator van bevoegd gezag van elke school). Ik gebruik alleen de toetsscores en niet de slaagpercentages. De HAVO-school met een 9,91 heb ik uit mijn analyse bestand verwijderd, omdat de score van deze outlier niet zou kloppen. VWO en HAVO kregen een andere rekentoets (3F) dan het VMBO (2F). De toekenning van scores was gelijk voor VWO en HAVO leerlingen. Voor VMBO leerlingen was de toekenning van scores verschillend: VMBOb kregen een score volgens de normale procedure van de 2F toets. VMBOb leerlingen kregen er een punt bij, VMBOgt leerlingen kregen een punt minder. Deze publicatie gebeurde niet vrijwillig. Twee onderwijsjournalisten (Buitelaar, Vink) hebben onlangs via de Wet Openbaarheid Bestuur (WOB) openbaarmaking afgedwongen.

Scholen die onder hetzelfde BRIN-nummer meerdere vestigingen in dezelfde gemeente hebben worden als een eenheid behandeld: de rekenscore is geaggregeerd naar BRIN-niveau in de betrokken gemeente. Aan deze data heb ik via deze BRIN-nummers de 4-cijferige postcodes van alle leerlingen en het gemiddeld advies van de derde klassers toegevoegd. Deze gegevens zijn publiek beschikbaar bij DUO en DANS. BRIN-nummers met vestigingen in meerdere gemeenten zijn buiten beschouwing gelaten, omdat indicatoren van postcode en advies niet eenduidig toe te kennen zijn. Scores van scholen waarin minder dan 10 leerlingen deelnamen aan de rekentoets zijn niet gepubliceerd door OC&W. Met behulp van de Leefbaarometer en de 4-cijferige postcode heb ik de sociaal-economische samenstelling van de leerling-populatie per BRIN-nummer en onderwijstype berekend (zie hier voor meer informatie over deze berekening). De uitkomsten zijn gecorrigeerd voor de grootte van de scholen, gemeten met het aantal eindexamenkandidaten.

Scores
Tabel 1 geeft de gemiddelde scores voor de opgenomen BRIN-nummers per onderwijstype (cijfer). Wat opvalt is de lage score voor HAVO-leerlingen in vergelijking met VWO. De standaarddeviaties in de schoolgemiddelden is voor alle onderwijstypen ongeveer even groot en redelijk substantieel. De minimum en maximum score laten zien dat het verschil in gemiddelde rekenscore tussen de hoogste school en de laagste school groot zijn. De geringe scheefheid in de verdeling van rekenscores betekent dat de verdeling van gemiddelde scores min of meer normaal is.

Tabel 1: gemiddelde rekentoets per BRIN nummer en per onderwijstype

null Beeld anp
Beeld anp

Deze verschillen in gemiddelde rekenscores tussen scholen zouden het gevolg kunnen zijn van verschillen in leerling-populaties en toelating- en selectiebeleid van scholen. Daarom berekende ik de te verwachten rekenscore, gegeven de sociale herkomst van de leerling-populatie en het gemiddeld advies van de derdeklassers (zie hier voor een soortgelijke toepassing). Het verschil tussen deze te verwachten rekenscore en de werkelijke score noem ik in tabel 1 de afwijking.

Een school met hoger score dan verwacht mag worden gezien de sociale herkomst van de leerling-populatie en het gemiddeld advies van de derdeklassers heeft een positieve afwijking. Een school met lager score dan verwacht mag worden gezien de sociale herkomst van de leerling-populatie en het gemiddeld advies van de derdeklassers heeft een negatieve afwijking. De standaarddeviatie van deze afwijking is echter even groot: de verschillen tussen gemiddelde rekenscores van scholen zijn dus niet te verklaren door verschillen in leerling-populaties. De verschillen tussen de meest afwijkende scholen blijft substantieel: tussen de 2 tot 3 punten.
De verschillen tussen gemiddelde rekenscores van scholen kan dus niet verklaard worden door verschillen in leerling-populaties en toelating- en selectiebeleid van scholen.

Samenhang rekenscores binnen scholen
Het voorafgaande toont echter nog niet aan dat de substantiële verschillen in gemiddelde rekentoets tussen scholen ook systematisch zijn. Om dat laatste na te gaan bereken ik de samenhang tussen de rekenscores binnen BRIN-nummers. Dit betekent dat alle BRIN-nummer met slechts een onderwijstype (bijvoorbeeld categoriale gymnasia) niet in deze berekening zijn weggelaten.

Tabel 2 laat zien dat de samenhang tussen de rekenscores van nabijgelegen onderwijstypen binnen BRIN-nummers (VWO-HAVO; VMBOgt-VMBOk, etc) hoog is: tussen de .60 en .40. Samenhang tussen verder afgelegen onderwijstypen binnen BRIN-nummers (VWO-VMBOgt; VMBOgt-VMBOb) lager zijn maar nog steeds substantieel. Dit betekent dat een hoge of lage rekenscore van een onderwijstype binnen een scholengemeenschap samenhangt met een hoge of lage rekenscore van een ander onderwijstype binnen diezelfde scholengemeenschap (=BRIN nummer binnen zelfde gemeente). In vergelijking met de samenhang tussen het gemiddelde van alle CE-cijfers van nabijgelegen onderwijsnummers binnen BRIN-nummers (tussen .50 en .30) is de samenhang tussen rekenscores hoog (eigen berekening op grond eindexamen 2013).

Tabel 2: Samenhang tussen rekentoetsscores van verschillende onderwijstypen binnen zelfde BRIN-nummer

Tabel 3 laat zien dat deze samenhang tussen rekenscores binnen BRIN-nummers niet verklaard kan worden door overeenkomst in leerling-populaties en toelating- en selectiebeleid binnen BRIN-nummers. Ook na correctie voor leerling-populaties en gemiddeld advies derdeklassers blijven de samenhangen hoog, hoewel ze door de correctie iets kleiner worden. Met andere woorden: er zijn systematische verschillen tussen de rekenscores van scholen.

Tabel 3: Samenhang tussen afwijking van verwachte rekentoets (op grond sociale compositie & advies-instroom) van verschillende onderwijstypen binnen zelfde BRIN-nummer

Verschillen tussen onderwijstypen
Tabel 4 laat zien dat de lage score van HAVO niet veranderd door rekening te houden met verschillen in de sociaal-economische achtergrond van leerlingen. Voor de interpretatie van de parameters van de onderwijstypen is van belang zich te realiseren dat VWO en HAVO een zwaardere toets (3F) kregen van het VMBO (2F) en dat binnen het VMBO de scores verhoogd (VMBOb) of verlaagd zijn (VMBOgt).

Tabel 4: regressie van onderwijstypen en sociale compositie school op gemiddeld rekencijfer van scholen

null Beeld anp
Beeld anp

Conclusie
Deze analyse van de beschikbare rekenscores laat zien dat er systematische verschillen tussen scholen bestaan wat betreft de hoogte van de scores op de rekentoets. Dit betekent nog niet dat deze systematische verschillen alleen maar het gevolg kunnen zijn van beleid van scholen met betrekking tot rekenen en de toets (onderhoud rekenvaardigheid; training voor toets; motivatie leerling voor toets; kwaliteit docenten betrokken bij rekenen). Andere verklaringen zijn ook nog mogelijk, bijvoorbeeld verschillen in kwaliteit rekenonderwijs van aanleverende basisscholen. Visuele inspectie van de scores van de afzonderlijke scholen (hier niet weergegeven omdat ik ben gestopt met publiceren van afzonderlijke schooluitkomsten) geeft echter geen steun aan de verklaring van verschillen in rekenscores door profielverschillen tussen scholen (afgemeten aan procenten eindexamenkandidaten in de verschillende profielen).

De claim dat de verschillen in rekenscores betekenisloos zouden zijn, omdat de hoogte van de scores op toeval zouden berusten en dus niet systematisch tussen scholen varieert, lijkt mij weerlegd.

Jaap Dronkers is hoogleraar onderwijssociologie aan de universiteit van Maastricht

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2021 DPG Media B.V. - alle rechten voorbehouden