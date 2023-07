Onder studenten is ChatGPT mateloos populair als brainstormpartner en schrijfhulp. Maar hoe moet een universiteit handelen als het vermoeden bestaat dat studenten massaal de chatbot hebben ingezet voor het schrijven van een paper? Die vraag is niet makkelijk te beantwoorden, blijkt uit deze casus aan de VU.

Als docent Anders Schinkel in april de scores van de Engelstalige opdracht voor het vak pedagogische ethiek onder ogen krijgt, valt hem iets vreemds op: ze pakken veel hoger uit dan in voorgaande jaren. Ook is er een aanzienlijk verschil tussen de scores van de Engelse papers en die van de Nederlandstalige, die beide voor hetzelfde vak aan de Vrije Universiteit (VU) Amsterdam moesten worden ingeleverd. En er is nog iets: de stijl waarin papers zijn geschreven, zeker het begin en de eindes ervan, komt sterk overeen.

Schinkel krijgt argwaan: zouden studenten gebruik hebben gemaakt van ChatGPT? En zo ja, wat moet hij dan doen? De VU-docent besluit de examencommissie in te lichten. Zijn studenten laat hij per mail weten dat het ‘door omstandigheden’ niet lukt om de papers op tijd na te kijken.

Ruim twee weken later krijgen de studenten bericht van de examencommissie: na uitgebreid onderzoek is gebleken dat ‘op grote schaal onregelmatigheden’ zijn aangetroffen in de Engelstalige papers. Omdat de kwaliteit van het bachelordiploma hierdoor in het geding komt, heeft de examencommissie besloten het paper voor alle studenten ongeldig te verklaren. Er komt een vervangende toets.

Het bericht slaat in als een bom, want – zo speculeren de studenten in de wandelgangen – dit kan eigenlijk maar één ding betekenen: fraude. En daar staan verregaande consequenties tegenover, met in het uiterste geval uitschrijving van de universiteit. Voor de derdejaarsstudenten, die in de afrondende fase van hun bachelorstudie zitten, een rampscenario waar ze liever niet aan denken. Op 15 mei, zo krijgen ze te horen, zal het besluit tijdens een bijeenkomst worden toegelicht.

Wanneer is het fraude?

De VU is niet de enige universiteit die te maken heeft met de opmars van kunstmatige intelligentie (AI) in het onderwijs. Vooral ChatGPT, de zelflerende chatbot die coherente antwoorden kan geven op complexe vraagstukken, blijkt mateloos populair als brainstormpartner, schrijfhulp of spellingcontroleur. 30 procent van de Nederlandse studenten maakt er geregeld gebruik van, meldde onderzoeksbureau GfK onlangs nog.

Terwijl studenten de innovatie stevig omarmen, worstelen middelbare scholen, mbo’s, hogescholen en universiteiten met de vraag wat dit betekent voor de inrichting van het onderwijs. Als scholieren of studenten met behulp van AI in een handomdraai een goed geschreven essay of profielwerkstuk kunnen produceren, zijn die toetsingsmethoden dan nog wel geschikt? En waar ligt de scheidslijn tussen geoorloofd gebruik en fraude?

Het zijn vragen die niet makkelijk te beantwoorden zijn, blijkt uit de casus aan de VU, die de Volkskrant aan de hand van gesprekken met studenten, mailwisselingen met docenten en diverse documenten heeft gereconstrueerd.

De VU wil alleen vanuit de woordvoering reageren. De universiteit, zo laat de woordvoerder in een schriftelijke reactie weten, volgt de ontwikkelingen op het gebied van AI op de voet. Er is een werkgroep in het leven geroepen en binnen het netwerk van koepelorganisatie Universiteiten van Nederland vindt geregeld landelijk overleg plaats. Ook is er samen met de Universiteit van Amsterdam (UvA) een taskforce opgezet over hoe AI in het onderwijs kan worden toegepast.

Over wanneer er sprake is van fraude, kan de woordvoerder kort zijn. ‘Als teksten van AI-auteurs worden opgevoerd als eigen werk, dan geldt dit als fraude.’ Ze verwijst naar het examenreglement van de universiteit, waarin is opgenomen dat ingeleverd werk wordt bestempeld als fraude als ‘een examinator niet kan vaststellen of jij (of een ander), origineel en zelfgemaakt werk hebt ingeleverd’.

Maar in de praktijk blijkt het vaststellen van fraude met ChatGPT een stuk lastiger. Een sluitende methode hiervoor bestaat nog niet. Digitale programma’s die plagiaat kunnen opsporen, werken op basis van herkenning van exacte stukken tekst. ChatGPT genereert steeds weer nieuwe, unieke teksten. Er bestaan wel AI-detectoren, maar die zijn vanwege het hoge risico op valse positieven niet betrouwbaar.

Bij zeker vijf universiteiten buigen de examencommissies zich nu over gevallen van mogelijke fraude met ChatGPT, bleek vorige maand uit een rondgang van NRC. De krant constateerde dat het beleid van universiteiten omtrent het inzetten van de chatbot varieert van aanmoedigende tolerantie tot een regelrecht verbod.

De VU zit aan de strenge kant: gebruik van ChatGPT is in principe niet toegestaan, tenzij een docent anders besluit. ‘Docenten worden opgeroepen om aan te geven welk uitgangspunt voor hun vak geldt op het gebied van gebruik van AI-tools en daarover in gesprek te gaan met studenten’, aldus de woordvoerder.

Gejoel in de collegezaal

Op 15 mei zit de collegezaal tjokvol gespannen derdejaarsstudenten pedagogische wetenschappen. Zometeen zullen ze te horen krijgen waar het bericht van de examencommissie om de Engelstalige papers ongeldig te verklaren op is gebaseerd.

Hun vrees wordt al snel bevestigd door opleidingsdirecteur Marjolein Dobber, die de bijeenkomst samen met examinator Anders Schinkel leidt. ‘We zitten nu in een situatie waar studenten op grote schaal fraude hebben gepleegd’, zegt ze. Voor het eerst horen de studenten dat dit te maken heeft met ChatGPT. De vervangende toets zal over twee weken al plaatsvinden.

Vanuit de zaal klinkt gejoel. Sommige studenten beginnen te huilen. ‘We zaten in de laatste periode van het jaar’, verklaart student Sanjana (25) de hoogoplopende emoties. Ze wil niet met haar achternaam in de krant uit angst dat dit negatieve gevolgen voor haar verdere loopbaan heeft. ‘Er kwamen nog drie andere tentamens aan. Ik dacht: wat nou als ik hierdoor mijn bachelor niet haal en studievertraging oploop?’

Beeld Matthew Holland

Afgezien van de stress is er nog een reden dat de aankondiging Sanjana zwaar valt: voor haar paper heeft ze geen ChatGPT ingezet. ‘Het voelde heel onredelijk. Ik werd gestraft voor iets wat ik niet heb gedaan.’ Hetzelfde geldt voor Milan Koers (24). Hij gebruikt de chatbot geregeld om stukken tekst samen te vatten, zodat hij sneller tot de kern komt. Maar AI is volgens hem op dit moment nog niet geschikt om een goed beargumenteerd paper op wetenschappelijk niveau mee te schrijven.

De studenten die voor de opdracht geen ChatGPT hebben benut, verenigen zich in een WhatsAppgroep. Ze vragen zich af waarom ze niet individueel zijn beoordeeld op hun kennis en kunde. Met andere woorden: waarom moet de hele lichting – en dus ook de studenten die naar eer en geweten hebben gehandeld – boeten voor de aangetroffen onregelmatigheden? En waarop is de beschuldiging van fraude precies gebaseerd?

In een poging antwoorden te krijgen op deze vragen, bestoken de studenten opleidingsdirecteur Dobber en docent Schinkel in de dagen na de bijeenkomst met mails. De docenten zijn zich ‘allen zeer bewust’ van het feit dat een groep ‘ten onrechte getroffen wordt’, stelt Dobber. ‘Deze maatregel wordt genomen omdat de examencommissie geen andere mogelijkheid ziet om de kwaliteit van toetsing van dit vak te garanderen.’

‘Onbevredigend besluit’

Schinkel, die het besluit van de examencommissie in een van zijn mails ‘onbevredigend’ noemt, geeft toe dat hij zelf ook worstelt met de vraag hoe hij ‘in tijden van AI’ moet beoordelen wat studenten weten, begrijpen en kunnen. ‘Wellicht laat de problematiek rond AI zien dat gangbare vormen van onderwijs en/of toetsing in bepaalde opzichten tekortschieten’, schrijft hij. ‘Daar liggen belangrijke filosofische én praktische vragen.’

De examinator raakt hiermee aan een wezenlijk punt, want de huidige inrichting van het onderwijs lijkt niet opgewassen tegen de razendsnelle ontwikkelingen van AI. Vanuit het onderwijsveld klinken geluiden voor een grondige herziening: enerzijds moet worden gewaarborgd dat studenten zelf de vaardigheden ontwikkelen die nodig zijn om te kunnen afstuderen, anderzijds moeten de kansen worden benut die kunstmatige intelligentie biedt.

De technologie kan in potentie overbelaste leraren ondersteunen, bijvoorbeeld door administratieve taken uit handen te nemen, toetsvragen te formuleren of studenten automatische feedback op hun werk te geven. Ook wijzen AI-experts op het ‘democratische’ effect van ChatGPT: anders dan bij dure bijlesbureaus, kan iedereen er gratis een beroep op doen – al is de vraag voor hoelang nog?

‘Het nadenken over kansen en risico’s van AI voor het voortgezet onderwijs komt op gang, maar is nog niet vergevorderd’, zegt Stan Temeer, woordvoerder van de VO-raad, de vereniging van scholen in het voortgezet onderwijs. ‘Hier zijn nog veel stappen te zetten.’

In het hoger onderwijs verschilt de mate waarin AI mag worden toegepast nu per instelling, en zelfs per faculteit, zegt Ruben Puylaert, woordvoerder van de VSNU, de belangenorganisatie voor universiteiten. ‘De toepassingen voor een opleiding informatica zullen anders zijn dan bijvoorbeeld die bij een taalstudie.’

Om fraude met ChatGPT te ondervangen, raden veel hogeronderwijsinstellingen hun docenten voorlopig aan om studenten zo veel mogelijk gebruik te laten maken van recente bronnen (van ná 2021) die bij voorkeur achter een betaalmuur staan, omdat ChatGPT hiertoe nog geen toegang heeft. Ook wordt nagedacht over andere toetsvormen: mondelinge examens of vlogs in plaats van schriftelijke verslagen. Daarnaast moet de inhoud op de schop: vraag studenten naar een persoonlijk standpunt dat ze moeten onderbouwen in plaats van een objectieve analyse, tipt de Universiteit Leiden bijvoorbeeld haar medewerkers.

Als uiterste maatregel denken sommige universiteiten eraan om studenten stukken te laten schrijven in een ‘gecontroleerde omgeving’. Op school dus, met een laptop zonder internetverbinding. Of desnoods met pen en papier.

Klacht

De studenten pedagogische wetenschappen krijgen weinig mee van het standpunt van de VU op het gebied van AI. ‘Er wordt eigenlijk nooit over gepraat’, zegt Milan Koers. Ook bij de opdracht voor het vak pedagogische ethiek is volgens hem niets gezegd over de richtlijnen die gelden voor het gebruik van ChatGPT.

Dat er vervolgens wel zo streng wordt opgetreden, nu het vermoeden bestaat dat studenten de chatbot hebben ingezet, vindt hij onrechtvaardig. Om te onderzoeken of er juist is gehandeld, besluit Koers samen met andere studenten tot een procedure bij het College van Beroep voor de Examens, een onafhankelijk juridisch orgaan waar studenten beslissingen van examencommissies kunnen aanvechten. Onder de brief, waarin wordt opgeroepen om het besluit ongeldig te verklaren, staan 28 namen. Ongeveer eenvierde van alle deelnemers van het vak.

Dat veel studenten de brief niet willen ondertekenen, kan er volgens Koers op duiden dat ChatGPT inderdaad op grote schaal is toegepast. ‘Als je wordt beschuldigd van fraude, dan denk je wel twee keer na voordat je je naam onder zo’n brief zet’, zegt hij. ‘Dan blijven alleen de studenten over die echt zeker weten dat ze eerlijk hebben gehandeld.’

Tijdens een daaropvolgend gesprek met de examencommissie van de VU krijgt Koers te horen dat hij zich het beste kan neerleggen bij het besluit van de vervangende toets. Over fraude met ChatGPT wordt in het gesprek met geen woord gerept. Wel wordt er gesproken over verschillende ‘onregelmatigheden’ die zijn aangetroffen, waaronder spel- en typefouten en niet-bestaande referenties. Voor de eindexamencommissie biedt dit voldoende grond om tot de aangekondigde maatregel te komen.

Koers sluit het gesprek af met een onbevredigend gevoel, zegt hij. In plaats van een open uitwisseling over de richtlijnen voor het gebruik van ChatGPT verschuilt de universiteit zich achter onregelmatigheden, vindt hij. ‘Terwijl ik nu juist had gehoopt om samen met de examencommissie inzicht te krijgen in wat nou de werkwijze is rondom het gebruik van ChatGPT, zodat we hier samen op kunnen reflecteren.’

Het vervolg

De procedure bij het College van Beroep kan daar mogelijk meer duidelijkheid over verschaffen, maar de studenten hebben inmiddels besloten het beroepschrift in te trekken. Hun gebrek aan juridische ervaring maakt het doorlopen van de procedure tot een ingewikkelde exercitie. Bovendien vinden de studenten dat het weinig zin meer heeft: de vervangende toets is al achter de rug.

Sanjana en Milan Koers hebben het vak afgesloten met een 6 en een 6,5. Na de zomer beginnen ze aan hun master, op dezelfde universiteit.

ChatGPT zal zich tegen die tijd weer verder hebben ontwikkeld. De vraag hoe studenten ermee om moeten gaan, wordt daarmee almaar relevanter. Zolang er geen duidelijke richtlijnen zijn, vergroot dat de kans dat universiteiten en andere onderwijsinstellingen te maken krijgen met een opeenhoping van gecompliceerde cases van mogelijke fraude met AI. Ook de VU.

‘Zorgelijk’, vindt student Koers. Tijdens het gesprek met de examencommissie vergeleek een van de leden de casus met een brandalarm dat plotseling afgaat tijdens een tentamen, waardoor alle studenten de ruimte moeten verlaten, ook diegenen die zich goed hebben voorbereid. ‘Maar ChatGPT is helemaal niet zo onvoorspelbaar’, zegt Koers. ‘De chatbot bestaat al maanden. Pas als er niet openlijk over wordt gesproken, kan het een brandalarm worden.’