Woordenschat

Een internetspelletje moet aan het licht brengen welke woorden in het Nederlandse taalgebied begrepen worden. Spelen met taal voor de wetenschap.

Latuw. Vetelen. Narcis. Canneleren. Mondvlees. Rompertje. De woorden verschijnen in hoog tempo op het beeldscherm. Dit is een testje. En de proefpersoon die het testje uitvoert, moet aangeven of het langsflitsende woord wel of niet bestaat in het Nederlands.


Met pretlichtjes in de ogen volgt onderzoeker Marc Brysbaert wat de verslaggeefster van het testje bakt. Wanneer er honderd woorden de revue zijn gepasseerd, velt het computerprogramma een oordeel: de proefpersoon heeft x woorden goed beoordeeld en y fout. En daarmee zoveel procent van de test met goed gevolg afgelegd. Game over!


Niet tevreden? Gefrustreerd? Dan staat het u vrij nog zo'n testje te doen. En daarna nog een. Zo veel als u wilt. Want er zijn 75 duizend testwoorden beschikbaar en u krijgt er maar honderd per ronde. Fanatieke spelers kunnen dus lang lol hebben van dit wetenschappelijke onderzoek.


Het testspel waarbij deelnemers moeten beslissen of een gepresenteerd woord bestaat of niet, is vanaf vandaag gratis toegankelijk op internet. Spelers bewijzen de wetenschap een dienst, want ze werken mee aan een grootschalig taalkundig en psycholinguïstisch onderzoek. Dat vormt de vijfde editie van het Groot Nationaal Onderzoek. De hoofdvraag: welke en hoeveel woorden kennen we op dit moment?


De woordentest is ontsproten aan het brein van Marc Brysbaert, hoogleraar experimentele psychologie en psycholinguïstiek aan de Universiteit Gent. Samen met de psycholinguïsten Emmanuel Keuleers en Pawel Mandere heeft hij de test in de vorm gegoten van een geinig computerspelletje. Dat spel levert materiaal voor een onderzoek naar de woordenschat, waaraan de Gentenaren al een aantal jaar werken.


Brysbaert en Keuleers leiden een zogeheten Odysseus-project, betaald uit een fonds voor excellent onderzoek, en daarmee de Belgische evenknie van de Nederlandse Spinozapremies. In 2008 kregen de Gentenaren 2,8 miljoen euro voor het woordenschatonderzoek.


Het grootschalige onderzoek is het vervolg op kleinere proefstudies die Brysbaert en Keuleers eerder uitvoerden met Nederlandse, Franse en Engelse woorden. Daarbij legden ze veertig proefpersonen ieder 28 duizend echte en nepwoorden voor. Een taak waarmee die langdurig zoet waren.


Keuleers: 'Bij die proef kenden we alle factoren die invloed hadden gehad op de gegeven antwoorden. Wie heeft wanneer wat opgetekend? Hoe laat op de dag? Hoe lang dacht de proefpersoon na? Was het antwoord op de voorgaande vraag misschien fout? Zo ja: wat was de invloed daarvan, deed de proefpersoon daardoor misschien langer over het antwoord? Zo kregen we dus niet alleen inzicht in taalkundige kwesties, maar ook antwoord op psychologische en taalpsychologische vragen.'


Met de kleinere talenstudies bereidden ze het huidige Groot Nationaal Onderzoek voor. Belangrijkste doel, aldus Brysbaert: 'Een momentopname maken van de kennis van de Nederlandse woordenschat anno 2013'. Daartoe hebben ze zo veel mogelijk Nederlandstalige proefpersonen nodig. Eerlijk gezegd zal Brysbaert pas echt gelukkig zijn wanneer 100 duizend mensen zo'n lijstje op internet afwerken. 'Om serieus te kunnen beslissen of een enkel woord door velen wordt gekend, moet je het toch wel honderd keer laten beoordelen. Om 75 duizend woorden te toetsen heb je dan 100 duizend proefpersonen nodig.'


Ondertitels

Van die 75 duizend aangeboden woorden zijn er 52 duizend echt en 23 duizend nep. Zijn er meer Nederlandse dan Vlaamse woorden opgenomen of omgekeerd? Geheime straattaalwoorden? Staan er dialectwoorden op die lijst, met het gevolg dat spelers uit bepaalde regio's meer antwoorden weten en daardoor hoger scoren?


Niets van dit alles, zegt Brysbaert. Van de 52 duizend bestaande woorden zijn er 20 duizend ontleend aan de erkende basiswoordenlijst van taalkundigen Hazenberg en Hulstijn. Woorden langer dan tien letters, samenstellingen en eigennamen zijn niet opgenomen. Omdat hij een corpus wil van zeker 50 duizend woorden, heeft Brysbaert vervolgens de uitgeschreven ondertiteling opgesnorkeld van speelfilms en anderstalige programma's. Opbrengst: 134 duizend woorden, waarvan zo'n 32 duizend bruikbare. 'Mijn zorg is niet dat ik woorden opneem die niemand kent, maar dat ik woorden vergeet die juist heel veel mensen kennen. Dat zou pas een blunder zijn!'


De 23 duizend nepwoorden zijn samengesteld door volgens een bepaalde procedure van bestaande woorden lettergrepen of klinkers te vervangen. Zo zijn nieuwe woorden ontstaan die door hun vorm wel echt zouden kunnen zijn, maar die niet bestaan.


Uit de op internet gemaakte testjes hopen de onderzoekers van alles te kunnen opmaken. Daarom willen ze dat de proefpersonen zich registreren. Niet met naam en toenaam: aan die kennis hebben de psycholinguïsten niets. De vraag is: zijn leeftijd, sekse, geboortejaar, geboorteplaats van invloed? En de opleiding of het gegeven dat de proefpersoon meerdere talen kent?


Uiteindelijk moet duidelijk worden welke woorden sprekers van het Nederlands het beste kennen. Welke woorden Groningers wel kennen en mensen uit West-Vlaanderen niet. Hoe de woordenschat van oudere mensen verschilt van die van jongere. Of er verschillen zijn tussen de woordkennis van mannen en die van vrouwen.


Aan de antwoorden op hun eerdere proeftests kunnen de onderzoekers al een aantal conclusies verbinden. 'Mensen herkennen die woorden het snelste die ze als kind heel vroeg hebben geleerd', zegt Brysbaert. 'En dan bedoel ik letterlijk woorden zoals kaboutertje, heks, leeuw. Opvallend genoeg zijn dat ook juist de woorden die mensen nog weten wanneer ze dement worden. De woorden die het eerste zijn geleerd, blijven ook als laatste over.'


Moedertaal

Aan de percentages goede antwoorden op de Frans- en Engelstalige tests zien de onderzoekers ook wie de proefpersonen vermoedelijk zijn. Wie minder dan 10 procent scoort, heeft een andere moedertaal en is net begonnen met het leren van de getoetste taal. Loopt de score tegen de 20 procent, dan is het ook iemand met een andere moedertaal, maar een gevorderde student. Is tegen de 40 procent van de antwoorden correct, dan is de proefpersoon een moedertaalspreker met een goed taalbegrip. Heeft de maker van de test meer dan 60 procent van de woorden goed beoordeeld, dan is het een moedertaalspreker met een uitstekende woordenkennis en een dito gevoel voor taal. Scoort de proefpersoon hoger dan 90 procent, dan gaat het meestal om iemand die beroepsmatig met het Nederlands bezig is.


De verwachting is dat niemand de test ooit honderd procent goed zal maken. Brysbaert: 'Toch niet zonder te spieken in een woordenboek. Liefst niet te lang nadenken, gewoon invullen.'


Het GNO heeft volgens Brysbaert en Keuleers direct praktisch nut voor de makers van vertaalwoordenboeken. Die moeten altijd kiezen welke woorden in Nederland en Vlaanderen werkelijk kunnen voorkomen en dus moeten worden opgenomen. Het GNO laat zien welke woorden Nederlandstaligen het beste kennen en dus het vaakst zullen gebruiken. Ook docenten die aan buitenlanders Nederlands moeten leren, hebben baat bij de resultaten.


De onderzoekers gaan in november aan de slag met de uitkomsten van alle ingevulde lijstjes. Maar de test blijft ook nadien online en iedereen kan de lijstjes blijven invullen. Nog jarenlang, als het aan Brysbaert en Keuleers ligt. Brysbaert: 'Onderzoekers kunnen over tien, twintig, tweehonderd jaar de Nederlandse woordenschat op dat moment vergelijken met die van nu. Dan kun je constateren welke woorden zijn verdwenen. Welke woorden nieuw zijn. Zo kun je het verglijden van de woordenschat pas echt goed zien.'


GROOT NATIONAAL ONDERZOEK

Het Groot Nationaal Onderzoek (GNO) is een verzamelnaam voor een reeks vraagstellingen. Aan de hele bevolking wordt gevraagd antwoord te geven. Hoe meer deelnemers, hoe betrouwbaarder de resultaten. Initiatiefnemers zijn de omroepen NTR en VPRO, en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek .


De vier eerdere edities gingen over emoties, slaap, rekenstrategieën en over de invloed van alledaagse stress op geheugen en aandacht. Deze vijfde ronde gaat over taal en de Nederlandse woordenschat. Dit GNO haakt in bij de onderzoeksvraag van de Gentse taalonderzoekers Marc Brysbaert en Emmanuel Keuleers. Die luidt: welke en hoeveel woorden kennen we op dit moment?


DOE MEE

Vanaf vandaag is op woordentest.ugent.be een gebruikersvriendelijke taaltest te vinden waarop Nederlandstaligen hun kennis van de woordenschat kunnen toetsen. De test is ook via de site van de Volkskrant te vinden; iedereen is welkom om deel te nemen. De resultaten zullen een momentopname vormen van de Nederlandse woordenschat anno 2013. De uitkomsten worden gepresenteerd in samenhang met het Groot Dictee der Nederlandse Taal in december 2013. Tegen die tijd komt de Volkskrant op de uitslagen terug.


Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2020 DPG Media B.V. - alle rechten voorbehouden