Spraakmakende computer

In Utrecht maakt een computer een uitspraak-woordenboek voor de Nederlandse taal. Dank zij het internationaal geaccepteerde fonetisch schrift kan dan de hele wereld leren Nederlands uit te spreken, correct èn plat....

MIEKE ZIJLMANS

HET NEDERLANDS is bij buitenlanders berucht om de problemen die de uitspraak met zich meebrengt. Het voorlezen van geschreven taal is een verschrikking. Doordat er veel meer klanken zijn dan letters, moet je zowat per geschreven woord uitvogelen hoe al die tekens deze keer uitgesproken moeten worden, liefst met een correcte klemtoon.

Veel mensen die zelf zijn grootgebracht met het Nederlands, leggen - volgens de normen van taalpuristen - levenslang de klemtoon verkeerd in woorden als 'notábelen', 'página', 'normáliter'. Of ze zeggen 'úniform' (kledingstuk) als ze 'unifòrm' (gelijkvormig) bedoelen. En ze spreken 'notoir' niet uit als notoor, maar zeggen systematisch nootwaar - wat volgens niet-puristen trouwens ook best is.

Voor dit soort vraagstukken biedt een uitspraakwoordenboek de oplossing. Een woordenlijst waarin na elk woord een klankweergave is opgenomen, plus de aanduiding van de plaats van de klemtoon of -tonen. Zulks in fonetisch schrift, een tekensysteem dat voor elke hoorbare klank een apart tekentje biedt. Dit soort woordenboeken is voor bijvoorbeeld het Engels, Duits en Frans al lang een alledaags gebruiksvoorwerp.

Voor het Nederlands is een groepje taalkundigen, fonetici, fonologen en morfologen nu bezig met het onderzoek voor, en de samenstelling van zo'n naslagwerk, omdat de twee uitspraakwoordenboeken die eerder zijn gemaakt alleen nog antiquarisch zijn te krijgen. Op initiatief van uitgeverij Het Spectrum en onder het toeziend oog van de Nederlandse Taalunie ontwikkelt het Onderzoeksinstituut voor Taal & Spraak aan de Universiteit Utrecht een nieuw, up to date uitspraakwoordenboek, waarin uiteindelijk tachtigduizend woorden opgenomen zullen zijn.

Deze week is een proefboekje met duizend woorden gelanceerd, dat voor commentaar en suggesties voorligt bij een groep taalspecialisten. Begin 1996 moet de uitgebreide versie drukklaar zijn. Het boek wil geen normen stellen voor iets als de 'beschaafde' uitspraak van het Nederlands: het zuidelijke 'carnavál' wordt opgenomen samen met het noordelijke 'cárnaval'. En hoewel de woordenlijst de uitspraak 'voor' en 'zee' met als beginletters v en z zal opnemen, meldt de inleiding dat dergelijke woorden veelal klinken als 'foor' en 'see', en dat dat niet fout is.

Heel nieuw aan dit derde Nederlandse uitspraakwoordenboek is het gebruik van de computer om die tachtigduizend woorden te voorzien van een goede uitspraakvorm. Voorheen werd zo'n boek samengesteld door voor elk woord handmatig een kaartje met informatie te maken. Nu is er een handvol letter-klank-vertaalprogramma's (in vaktaal: grafeem-foneem-omzetters) in gebruik.

Het gekozen systeem is ontwikkeld ten behoeve van een spraaksynthetisator, een apparaat dat kunstmatig spraak kan voortbrengen.

In dat project nam drs J. Heemskerk de omzetting van geschreven letters in klank-tekens deels voor haar rekening. Heemskerk heeft nu ook het werk voor dit uitspraakwoordenboek verricht. Ze gebruikte het internationaal erkende IPA-alfabet als fonetisch schrift, opdat het woordenboek uiteindelijk voor buitenlanders even bruikbaar zal zijn als voor Nederlandstaligen. Hoe dit schrift te lezen, wordt in een uitgebreide inleiding uitgelegd; bovendien geeft elke pagina met woordjes, als geheugensteun, nog eens het fonetisch alfabet.

De computer moest een aantal vaardigheden aanleren die de menselijke kaartjesmaker automatisch toepast, merkt Heemskerk op. Zo moet het systeem leren waar in gelede woorden de ene lettergreep ophoudt en de volgende begint, of waar in samenstellingen de grens tussen twee woorden ligt, omdat die grenzen bepalend zijn voor de uitspraak (hoofdas klinkt als hooft-as; maar loofdak klinkt als loof-dak).

Het opgemerkte verschil tussen 'úniform' en 'unifòrm' maakt duidelijk dat de computer door moet hebben dat woorden die hetzelfde worden geschreven meer dan één betekenis kunnen hebben, die hij beide moet geven. En het apparaat moet regels toepassen waardoor op het oog verwante woorden als ávonduur en avontúúr op de juiste plaats een klemtoon krijgen.

Het verwerken van al dit soort 'menselijke' inzichten in regelmatigheden en uitzonderingen maakt handmatige controle van alles wat de computer produceert toch nog nodig. En daarmee is Heemskerk het resterende halfjaar nog wel zoet, verzucht ze.

Mieke Zijlmans

Wilt u belangrijke informatie delen met de Volkskrant?

Tip hier onze journalisten


Op alle verhalen van de Volkskrant rust uiteraard copyright.
Wil je tekst overnemen of een video(fragment), foto of illustratie gebruiken, mail dan naar copyright @volkskrant.nl.
© 2023 DPG Media B.V. - alle rechten voorbehouden