Wetenschap Handschriften ontcijferen

Nieuw gereedschap voor historici: computers die handgeschreven historische papieren omzetten in digitale tekst


Oude handschriften lezen is voor de meeste mensen niet te doen. Maar de computer kan het wel. Die zet, met hulp van menselijke experts, in rap tempo kilometers handgeschreven historische papieren uit het Stadsarchief Amsterdam om in digitale tekst. Een schat aan informatie over de stad en haar inwoners komt daardoor vrij.

‘Op huijden den 8en augusti 1643 compareerde mij Henrick Schaeff notaris etc ende den ondergeschreven getuijgen Reijer Adriaensz Schagen, out ontrent xxxiiii Jaren.’ Beeld Stadsarchief Amsterdam

De teksten, afkomstig uit boeken van notarissen, zijn allesbehalve droog. Grietje Somer – zo schreef Cornelis Staal, notaris van de hoofdofficier – maakte haar achttiende-eeuwse steeg onveilig, omdat zij ‘met flessen pannen & potten uijt haer venster gooijt als er ijmant voorbij haer deur gaet’. Bovendien: soms liep gekke Grietje ‘met een bloot mes in de hand door de steeg, dat niemant durft passeeren, roepende dat haar de duijvel zoude bijstaen’. ‘Hoeren & dieven’, riep Grietje dan naar haar buren.

Het softwareprogramma Transkribus, dat de handschriften herkent, bestaat al een tijdje. Maar tot nu toe gebruikten onderzoekers het programma altijd om één of enkele handschriften om te zetten. Dat het nu gebombardeerd wordt met honderden handschriften en duizenden boeken, is nieuw. Gespecialiseerde vrijwilligers helpen via het platform VeleHanden vervolgens om die computerteksten weer te controleren, zodat het programma de fouten afleert. Door de veelvoud aan handschriften zijn die menselijke correcties hard nodig, temeer omdat niet elke notaris even leesbaar schreef.

Pauline van den Heuvel van het Stadsarchief Amsterdam leidt dit project genaamd Crowd leert computer lezen. Volgens haar kunnen al die nieuwe ontdekkingen het beeld van de geschiedenis van Amsterdam veranderen.

Pagina's in een Amsterdam notarisboek

Wat kunnen we ontdekken door computers al die handschriften te laten ontcijferen?

‘Iedere Amsterdammer ging in z’n leven wel een keer naar de notaris. Dus over veel van onze voorouders staat wel iets in de boeken. Dat geldt niet alleen voor Nederlanders, want Amsterdam was ook vroeger al internationaal georiënteerd. Ook voor bijvoorbeeld sommige Amerikanen – oorspronkelijk immers immigranten – zijn deze gegevens goud waard, omdat de documenten vaak de herkomstplaats van hun voorouders vermelden.

‘Dat betekent: enorme hoeveelheden data. Daarmee kunnen we de netwerken in Amsterdam in kaart brengen en namen in verband brengen met andere bronnen. Ik zie het nu als mijn persoonlijke missie om alle informatie in het archief naar buiten te brengen.’

Welke ontdekkingen sprongen eruit voor u?

‘In deze notarisarchieven vind je van alles: testamenten en contracten, ooggetuigenverklaringen bij misdrijven en boedel- en scheepsinventarissen. Soms zijn die heel droog, maar het wordt al spannender met verklaringen van scheepslieden die op een besneeuwd eiland strandden en ijsberen gingen schieten.

‘Onlangs kwamen we er dankzij deze notarisboeken achter dat er een vrije zwarte gemeenschap in Amsterdam woonde in de zeventiende eeuw. Dat wisten we eerder niet. Als we dan een zwart persoon op een portret van Rembrandt zagen, namen we aan dat het om een slaaf ging. Dat hoeft niet zo te zijn.

Computerprogramma Transkribus' vertaalt een eeuwenoude tekst. Beeld Marcel van den Bergh

‘Een ander voorbeeld is dat we onlangs bewijs vonden dat Johan Maurits, de gouverneur van Brazilië, op eigen naam ‘een merckelijke partije swarten’ kocht in Angola. Deze man is nogal een held in Brazilië, maar is – zoals we eigenlijk al vermoedden – dus zeker niet vrij van smet.

‘Zelfs een inboedelbeschrijving kan waardevol zijn. We hebben dankzij vermeldingen daarin nu al een paar keer kunnen achterhalen wie er op schilderijen stonden, of wie de schilder was. Dat vinden kunsthistorici natuurlijk heel interessant. Maar een van de grootste verrassingen was toch de spannende beschrijvingen van het straatleven. Als er hommeles was in de stad, vertelden ooggetuigen bij de notaris wat ze gezien hadden. Daar duiken onderzoekers nu bovenop: ze willen dit leven op straat reconstrueren.’

Moeten jullie de computer vaak verbeteren?

‘Dat valt mee, het programma herkent de handschriften op den duur voor 95 procent foutloos. Die 5 procent lijkt veel, maar dat is het niet: het zijn ook hoofdletters en leestekens.

‘Af en toe zie ik al dingen waarvan ik denk: hé, het lijkt er toch verschrikkelijk veel op alsof de computer hier logische kennis toepast die wij er niet bewust hebben ingestopt. Bijvoorbeeld: hier staat een jaartal, daarvoor staat een cijfer, dan zet hij daar automatisch de naam van de maand bij.’

Pauline van den Heuvel met eeuwenoude documenten in het stadsarchief van Amsterdam. Beeld Marcel van den Bergh

Hoelang gaat het nog duren voordat jullie alles hebben vertaald?

‘Lastig te zeggen. We zijn begonnen met de notariële akten, dat zijn 30 duizend dikke boeken. Als je die papieren achter elkaar legt is dat 3,5 kilometer. Dat is zoveel: er is geen mens die dat allemaal ooit kan zien.

‘Op de site van Alle Amsterdamse Akten kunnen mensen nu al prachtige verhalen uit de notarissenboeken vinden en lezen. Met alle informatie krijgt de lezer een goed beeld van de netwerken binnen Amsterdam en de rest van de wereld. Uiteindelijk ontstaat er dan een soort Facebook van het verleden.’

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright. Linken kan altijd, eventueel met de intro van het stuk erboven.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2019 de Persgroep Nederland B.V. - alle rechten voorbehouden