Unitekst

DE klimaatconferentie is mislukt. Toch zijn de modernste technische middelen ingezet bij het Haagse circus. Om de communicatie te optimaliseren, was gezorgd voor het simultaan vertalen in vele talen....

Ad Lagendijk

Na het falen van de conferentie kwam van een aantal kanten de suggestie dat, in plaats van regeringen, multinationals zich maar met grote internationale problemen zouden moeten gaan bezighouden.

Goeie genade! Concurrerende bedrijven. Die zijn er alleen maar op uit hun marktaandeel te vergroten. Ze lappen standaarden van andere aan hun laars en veranderen zelf voortdurend hun eigen standaard.

Nee, geen bedrijven. Of soms toch wel? Ik zou u vandaag een voorbeeld willen geven van een prachtige, vrijwillige afspraak tussen zo'n zeventig grote, internationale bedrijven die zich met informatie-technologie bezighouden. Een afspraak die regeringen in geen honderd jaar voor elkaar zouden hebben gekregen. Een overeenkomst die voor de wereldvrede meer zal betekenen dan menige gouvernementele conferentie.

De wereldwijd overeengekomen standaard heeft betrekking op het digitaal opslaan, bewerken en versturen van tekst, in welke taal deze tekst ook is opgesteld.

Een computer kent geen letters, alleen maar cijfers. Dus moet je als je tekst wil versturen, elk teken een cijfer geven. De Amerikanen zijn in begin jaren zestig begonnen met die standaard. Ze gebruikten 128 getallen (van 0 tot en met 127). De hoofdletter A bijvoorbeeld, kreeg het getal 65.

Voor Duitsers en Fransen was dat allemaal te beperkt, want letters met accenten konden niet worden verstuurd. De meeste computerfabrikanten gingen om die reden in de jaren zeventig al snel over tot 256 tekens. Dat was voor elk Europees taalgebied voldoende.

Maar ieder taalgebied had wel zijn eigen set van 256 tekens. Er zijn vandaag de dag wel honderd verschillende sets in gebruik. Dat veroorzaakt heel veel problemen, bijvoorbeeld als Serviërs een tekst naar Amerikanen willen sturen.

En hoe zit het met de Chinezen? Die hebben voor het Han zo'n 28 duizend tekens nodig. En de Koreanen voor het Hangul zo'n 12 duizend. Dit soort complicaties maakt het voor die landen ontzettend moeilijk te profiteren van de ontwikkelingen in de informatie-technologie.

Ik geloofde het eerst niet. Maar er is een wereldwijde standaard gekomen. Hij bevat 65 duizend tekens. En er zijn ook al afspraken gemaakt over de volgende 65 duizend. De overeenkomst is tot in detail geregeld (The Unicode Consortium: The Unicode Standard, Addison-Wesley (2000), 1040 pagina's en cd-rom). Ook is bijvoorbeeld afgesproken hoe je al die letters moet sorteren.

Het Hebreeuws. Het Tamil. Het runenschrift. De taal van de Khmer. Ik noem maar wat voorbeelden. Al die 'alfabets' staan erin met hun nummers. Er zijn naast meer dan veertig talen, ook vele andere tekensets gestandaardiseerd. Zoals alle gangbare wiskundige symbolen.

Nederland wil graag voorop lopen in de informatica. Van de kleine zeventig bedrijven die aan het Unicode Consortium deelnemen, is er geen enkele afkomstig uit ons land. Ook onder de honderden medewerkers lijkt op het eerste gezicht geen enkele landgenoot te zitten.

Toch is Nederland onmiskenbaar aanwezig. Eén van de 65 duizend lettertekens is van Hollandse afkomst. Het betreft onze lange 'ij'. Die heeft nummer 307.

Als er iemand nog suggesties wil voor kandidaten voor prijzen, of voor eredoctoraten in alfa-, bèta-, of gamma-wetenschappen: de initiatiefnemers van het Unicode consortium.

Meer over

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2022 DPG Media B.V. - alle rechten voorbehouden