Veel verdrietige woorden in boeken: verdrietige tijd
© EPA

Veel verdrietige woorden in boeken: verdrietige tijd

Waarin staan meer verdrietige woorden: in een boek dat tijdens de Tweede Wereldoorlog is gepubliceerd of een dat stamt uit de flowerpower? En wanneer ging het er in de letteren vrolijker aan toe: tijdens de roaring jaren twintig of in de Grote Depressie die erop volgde?

Allebei goed. Het taalgebruik in boeken blijkt grote overeenkomsten te vertonen met de periode waarin ze verschenen, blijkt uit Brits onderzoek dat is gepubliceerd in het wetenschappelijke tijdschrift PLoS ONE. Zet het gebruik van vrolijke en verdrietige woorden tegen elkaar af in de loop van de tijd en je krijgt een grafiek die bijna synchroon loopt met de staat van de wereld.

Er is een duidelijk verband, zegt cultureel antropoloog Alberto Acerbi van de universiteit van Bristol, de onderzoeksleider. 'Alleen: we kunnen op basis van deze cijfers geen verklaring geven hoe dat komt.' Ja, er is sprake van een dip - letterlijk - tijdens de Tweede Wereldoorlog. Maar of die ook wordt veroorzaakt door diezelfde oorlog, is niet met zekerheid te zeggen. 'Daarvoor is extra onderzoek nodig. Alles wat ik ter verklaring zou aanvoeren, zou speculatie zijn', aldus Acerbi.

Trends in taalgebruik
Het ging de onderzoekers ook niet zozeer om de verklaring, als om de methode. Niet eerder werden trends in taalgebruik op zo'n grote schaal blootgelegd, aldus Acerbi. Zijn team heeft vijf miljoen Engelse en Amerikaanse boeken uit de vorige eeuw geanalyseerd. Werken die eerder door Google zijn gedigitaliseerd. Daarmee is ongeveer 4 procent van alle boeken onderzocht die ooit zijn gepubliceerd.

De beschikbaarheid van deze zee van data is van grote betekenis voor de gedragswetenschap, stelt Acerbi. Zoals geologen met het afgraven van aardlagen meer te weten komen over onze geschiedenis, zo kunnen taalwetenschappers uit Googles digitale superbibliotheek trends naar boven halen die tot nu toe onzichtbaar bleven.

'Een van de grootste problemen van antropologie, en misschien wel van alle sociale wetenschappen, is dat het zeer lastig was om kwantitatieve data te vergaren over menselijk gedrag. De ongekende hoeveelheid gegevens die nu beschikbaar komt via Google, en ook via tweets, helpen ons trends veel beter zichtbaar te maken', zegt Acerbi.

Valkuilen
Taalwetenschapper Piek Vossen van de Vrije Universiteit in Amsterdam ziet het nut van de techniek, al wijst hij ook op valkuilen. 'Er zijn nu veel meer data beschikbaar, maar de waarde daarvan is niet altijd duidelijk.' Zo wordt veel onderzoek gedaan naar taalgebruik op Facebook, zegt Vossen. 'Alleen weet je eigenlijk niet goed wat je daar meet. Zijn mensen echt zoals ze zich daar voordoen?'

Acerbi ontdekte nog een belangrijk verschil: boeken die aan het eind van de 20ste eeuw verschenen, zijn aanmerkelijk minder emotioneel van toon dan die aan het begin van de eeuw. Of die trend zich heeft doorgezet, is nog niet te zeggen: er zijn nog niet genoeg boeken van de 21ste eeuw gedigitaliseerd om er betrouwbare uitspraken over te kunnen doen.