De opmars van pratende auto's

Dicteersoftware eigen Stemgeluid

In Aken worden achter gesloten deuren de stemmen opgepoetst die ons toespreken vanuit het autodashboard, de smartphone of de Xbox-spelcomputer.

Foto Warner Bros

Het kan niet meer, in advertenties en op autobeurzen: een vrouw in een verleidelijke pose bij nieuw, glimmend blik, over de motorkap leunend als een lustobject. Dus gooien de autofabrikanten het over een andere boeg. Ze stoppen een vrouw in het dashboard.

Pardon? Wel, 2016 wordt niet het jaar van de zelfsturende auto: sorry Google Car. 2016 wordt het jaar van de pratende wagen, zo luidt de boodschap in Aken, op het Duitse bruggenhoofd van Nuance, een specialist in spraakherkenning en spraak-naar-tekst-omzetting door computers. Fabrikanten gaan hun auto's uitrusten met slimme digitale assistenten. En die hebben vaak een vrouwenstem. Behalve in Saoedi-Arabië, waar vrouwen niet achter het stuur mogen zitten.

Dankzij spraakherkenning, zeggen ze bij Nuance, hoeven automobilisten hun handen niet van het stuur te halen om een adres in te voeren in hun navigatiekastje, om iemand te bellen of om van kanaal te wisselen als Frans Bauer op de radio een lied inzet om de roze rivierdolfijn voor uitsterving te behoeden. Ze kunnen gewoon zeggen: 'Geef me de snelste route naar het werk. Bel Joke. Zet Coldplay op.'

Tekst gaat verder onder de afbeelding.

Pratende Computers

Robotici vervloeken nog altijd het moment dat de tekenfilmserie The Jetsons werd uitgebracht, waarin een familie in de toekomst een huishoudrobot heeft. Die Rosie bleek weliswaar licht neurotisch, maar werd niettemin de meetlat waarlangs consumenten de echte robots legden - en die vallen dus altijd tegen. Pratende computers in films klonken decennialang ook beter en slimmer dan de blikken stemmen van onze pc's. De beroemdste is HAL9000 (een verwijzing naar fabrikant IBM - waarvan de letters een positie verder in het alfabet liggen) uit 2001: A Space Odyssey, een film uit 1968. TV-kijkers maakten rond die tijd ook kennis met een naamloze sprekende computer in Star Trek (1966 - 1969). Een voorproef op de slimme auto kreeg de consument met Kitt, de boordcomputer van Michael Knights Pontiac Firebird TransAm in de tv-serie Knight Rider (1982 - 1986). Kitts stem is van de acteur William Daniels, maar die wilde die prestatie niet op de titelrol zien. De Britse acteur Paul Bettany tekende voor de stem van J.A.R.V.I.S., de computer van miljardair Tony Stark in de drie Iron Man-films. Kevin Spacey is in Moon (2009) te horen als de GERTY, de digitale assistant van Sam Rockwell. In HER (2013) wordt Joaquin Phoenix verliefd op zijn computer. Geen wonder: die heeft de stem van Scarlett Johansson.

Foto K.I.T.T. van de Knight Rider

Nuance is bij het grote publiek al twintig jaar bekend om zijn dicteersoftware. Dragon NaturallySpeaking zet opgelezen teksten om in een getypt document. Maar het bedrijf levert ook de intelligentie achter digitale telefonistes, achter televisietoestellen die 'zet het Journaal op' verstaan en achter treinen en bussen die haltes omroepen.


Ze willen het in Aken 'ontkennen, noch bevestigen', maar het verhaal gaat dat Nuance ook de bouwstenen levert voor Siri. Toen deze sprekende assistente in 2011 haar mond opendeed op de Apple iPhone, bood ze de consument voor het eerst een glimp van de toekomst waarin we tegen apparaten gaan praten.


Siri heeft de ramen opengegooid, erkent Nils Lenke, directeur project- management bij Nuance. Mensen gelóven nu dat spraakherkenning werkt. Een beetje moeite heeft de Duitser misschien met de menselijke trekjes die de scheppers van Siri en Cortana, van Microsoft, aan hun digitale assistenten geven. Op een specifieke vraag zoals 'Wat is de zin van het leven?' geeft Siri het gevatte antwoord: '42', een verwijzing naar Douglas Adams' The Hitchhiker's Guide to the Galaxy.


Lenke: 'Die grappen brengen mensen gemakkelijk in de waan dat ze met echte mensen praten. Je wekt te hoge verwachtingen, waardoor het tegenvalt als een persoonlijke assistent een antwoord schuldig blijft. Het zijn geen mensen, het zijn machines.'

Dragon Drive, de automotive assistant van Nuance, tapt geen moppen. Als je rijdt moet je niet worden afgeleid, zegt directeur marketing Fatima Vital resoluut. 'Van een auto-assistent verwacht je relevante informatie, op het juiste moment. Dat hij je naar een benzinestation wijst als je tank bijna leeg is. Die weet waar je bij je bestemming kunt parkeren. Die leert wie de leden van je gezin zijn, zodat-ie bij 'bel Joke' weet dat je je vrouw wilt bellen.'

Nuance onderzoekt allerlei scenario's waarin Dragon Drive slim moet reageren. Zo moet de assistant weten of de bestuurder iets roept, of iemand op de achterbank. Vital: 'Als het verkeer hectisch is moet de assistant misschien duidelijk maken dat je even niet moet grasduinen in de muziek op je autoradio. Als je aan de andere kant vijf uur lang op de snelweg zit, moet het programma je helpen wakker te blijven.'

In Aken worden de auto-assistenten uitvoerig getest. In een laboratorium zitten testers achter een bureau waarop de losse elementen van een autodashboard staan opgesteld, via een knoedel kabels verbonden met computers, meetapparatuur en microfoons. Verboden te fotograferen zegt een bord boven de deur: de rommelboel strookt niet met het gestroomlijnde imago van de automerken. 'We leggen duizenden kilometers af', grapt een van de testers over zijn werk, 'maar we geraken nooit ergens.'

Tekst gaat verder onder de afbeelding.

Foto HAL9000
Foto J.A.R.V.I.S. - Iron Man

Spraak herkennen is de helft van het karwei dat Dragon Drive moet klaren. De auto-assistent moet ook kunnen terugpraten, dus computerteksten in klanken omzetten en vooral zo natuurlijk mogelijk klinken. In de vier decennia ontwikkeling die tekst-naar-spraak heeft doorgemaakt zijn grote stappen gemaakt, zegt onderzoeksdirecteur Christophe Couvreur van Nuance. 'De computer klinkt al niet meer zo mechanisch als tien, twintig jaar geleden.'


De voorbeelden die de Fransman laat horen klinken nog niet als in Her, de film uit 2013 waarin Joaquin Phoenix verliefd wordt op zijn computer die niet alleen de stem heeft van Scarlett Johansson, maar ook zijn stemmingen aanvoelt. Dat laatste gaat nog wel even duren, erkent Couvreur, en dat eerste is al duivels ingewikkeld. 'Spraak-naar-stem-software leest woorden op in brokjes, in taalklanken. Hoe vlakker de stem, hoe makkelijker het is om die stukjes aan elkaar te lijmen tot woorden en zinnen.'


Nuance heeft stemmen wel subtiel persoonlijker en warmer gemaakt. Couvreur: 'Het is mooi als een nieuwslezende computer onderscheid kan maken tussen een natuurramp en de geboorte van een koningskind.' Net als Siri specifieke vragen met een wisecrack standaardkwinkslag beantwoord, kunnen taalingenieurs met een truc wel emotie leggen in de reactie van een robot. 'Je gebruikt dan geen tekst-naar-spraakautomaat, maar je laat de computer bij een specifieke zin een geluidsfragment afspelen, ingesproken door een stemacteur.'

Nuance

130 miljoen auto's gebruiken software van Nuance. De nieuwe versie van Dragon Drive herkent 'natuurlijke spraak', in plaats van vaste commando's. Nuance ( jaaromzet 1,8 miljard euro) levert ook de app Swype aan 800 miljoen gebruikers van een iPhone of Android-telefoon, een intelligent toetsenbord. Voorts zet de scansoftware (OmniPage) gedrukte documenten om naar tekst die je op je computer weer kunt bewerken.

De klanten van Nuance vragen vaak een heel eigen stem voor hun digitale assistant. 'We hebben wel eens een Australisch bedrijf gehad dat niet tevreden was met de stem die we hadden uitgekozen, van een vrouw achter in de 20. Of ze niet jonger kon klinken. Dat is het mooie van computers. Daarmee kun je een stem veranderen.'


Een robotstem hoeft niet altijd een perfecte dictie te hebben. Sterker nog: dat kan soms contraproductief werken. Couvreur vertelt dat de Amerikaanse navigatiekastjes de namen van steden in Mexico met een vet Amerikaans accent uitspreken. 'Waarom? Omdat Amerikanendie namen anders niet herkennen.'


Er kan nog een reden zijn waarom een klant de robotstem omarmt, constateert Couvreur. 'We hebben Stephen Hawking aangeboden om de stem in zijn spraakcomputer minder blikkerig te laten klinken, minder mechanisch.' De beroemde Britse kosmoloog, die al veertig jaar in een rolstoel zit vanwege een ziekte die zijn lichaam langzaam verlamt, wilde er niks van weten. 'Dit is al twintig jaar mijn stem, zei hij.' 'Hij wil geen andere.'

Foto Star Trek computer
Meer over