Deze nieuwe vertaalmachine gaat de strijd aan met Google en Microsoft
© Thinkstock

Deze nieuwe vertaalmachine gaat de strijd aan met Google en Microsoft

Nee, de perfecte vertaling geeft DeepL nog niet, maar de automatische vertalingen van deze nieuwe dienst zijn opvallend goed in vergelijking met de bestaande concurrentie.

'Een enorme en woedende reddingsoperatie'. Wie Google Translate aan het werk zet om de woorden 'an enormous and frantic rescue operation' uit een recent artikel van The New York Times in het Nederlands vertalen, krijgt dit als antwoord. Het voorbeeld staat niet op zichzelf. De vorderingen in automatische vertalingen mogen dan indrukwekkend genoemd worden, het is nu nog vaak behelpen met slecht vertaalde woorden en, vooral, kromme zinsconstructies. Dat moet een stuk beter kunnen, meent DeepL, dat het op 'een enorme en hectische reddingsoperatie' houdt. De andere grote concurrent, Microsoft, besluit 'frantic' helemaal niet te vertalen.

Het Duitse DeepL lanceert vandaag een vertaalmachine die rechtstreeks de concurrentie moet aangaan met onder andere Google Translate en Bing Translator van Microsoft. Geen kleine spelers, eufemistisch geformuleerd. Toch claimt het bedrijf beter te zijn dan zijn bekende voorgangers. Zo schermt DeepL met hogere BLEU-scores, de gestandaardiseerde score die gebruikt wordt om de kwaliteit van automatische vertalingen aan te geven. Hoe kan dat?

Training

Volgens Hans Mooijer van DeepL heeft zijn bedrijf geprofiteerd van recente doorbraken in machine learning. Google moest vanwege deze nieuwe inzichten in kunstmatige intelligentie zijn jarenlange expertise met Google Translate overboord gooien en helemaal opnieuw beginnen, omdat met zelflerende netwerken betere resultaten worden behaald. Op hetzelfde moment begon DeepL ook met dergelijke netwerken. De Duitsers gebruiken hierbij een iets andere methode dan Google. Deze zogenoemde convolutionele neurale netwerken worden normaliter gebruikt voor het herkennen van plaatjes. Volgens DeepL levert het ook bij vertalen betere resultaten op.

Tegelijkertijd beschikte DeepL over een enorme hoeveelheid meertalige teksten om de netwerken te trainen. Het bedrijf kon voortbouwen op een al langer bestaand ander product: Linguee, een in Duitsland, Frankrijk en Spanje populaire zoekmachine voor vertalingen. In de afgelopen tien jaar heeft DeepL meer dan een miljard vertaalde teksten van hoge kwaliteit verzameld. Een supercomputer in IJsland wordt vervolgens gebruikt om de neurale netwerken met deze berg teksten te trainen. De netwerken leren zelfstandig hoe ze grammaticaal correct kunnen vertalen.

Apps

Dat is althans de bedoeling. Het huidige resultaat is nog verre van perfect. Net als de concurrentie moet de internetter kromme zinsconstructies op de koop toenemen, maar volgens Mooijer zal dit in rap tempo veranderen. Over een jaar of twee, drie zullen de vertalingen nagenoeg perfect zijn, voorspelt hij. 'Maar dat wil niet zeggen dat menselijke vertalers dan overbodig zijn. Voor de laatste nuances en subtiliteiten zullen die nodig blijven.' De concurrentie zit ondertussen niet stil. Googlewetenschapper Greg Corrado verklaarde onlangs dat de vertaalmachine van Google als gevolg van de vorderingen met kunstmatige intelligentie in korte tijd verbluffend goed zal worden.

Suzan Verberne van de Universiteit Leiden beaamt dat de ontwikkelingen razendsnel gaan sinds Google is overgestapt op deep learning. 'Zeker bij formele teksten gaat het nu al heel goed.' Andere factoren die een rol spelen zijn de lengte van de vertalen tekst (hoe langer, hoe beter een computer het doet) en de taalparen (Nederlands - Engels gaat bijvoorbeeld een stuk beter dan Engels - Nederlands).

DeepL Translator ondersteunt - via zijn site, apps volgen later - op dit moment 42 taalcombinaties tussen Nederlands, Engels, Duits, Frans, Spaans, Italiaans en Pools. In de nabije toekomst zullen meer talen worden toegevoegd, waaronder Mandarijn, Japans en Russisch. De dienst zelf is gratis; het bedrijf wil geld verdienen door, net als Google, zijn vertaaldiensten aan te bieden aan andere bedrijven.

Orkaan Harvey

DeepLs complete vertaling van de zin uit The New York Times over de gevolgen van orkaan Harvey luidt overigens: 'Wat voelde als een apocalyptische aanval van het slaan van regen en snel stijgende overstromingswaters bracht de vierde - grootste stad van de natie aan zijn knieën op Zondag, aangezien de wegen en de woonstraten zich aan rivieren, taille - hoge wateren zich van toegang tot huizen en ziekenhuizen versperren, en ambtenaren smeekten booteigenaren om binnen met een enorme en hectische reddingsoperatie in te schakelen.'

Er is, kortom, nog steeds werk aan de winkel bij Google, Microsoft én DeepL, zeker als er naar het Nederlands moet worden vertaald.