Praten met de reiscomputer
Wie van A naar B wil, kan vanaf dit najaar met een computer praten om te informeren welke trein hij moet hebben....
IN DE FILM Star Trek IV - The Voyage Home reist het ruimteschip Enterprise terug in de tijd naar de twintigste eeuw om de aarde te redden. Als bemanningslid Scotty een 'ouderwetse' personal computer ziet staan, grijpt hij naar de muis om zijn instructies in te spreken. Hij heeft de tijd niet meegemaakt dat je met de muis de cursor van de computer bestuurt.
Dat tijdperk duurt ook niet zo lang meer, voorspellen spraaktechnologen en computerdeskundigen. Op termijn praat de gebruiker tegen een computer, daar komt geen muis of toetsenbord meer aan te pas. Telefonisten kunnen concurrentie verwachten.
Komend najaar krijgen de vierhonderd informatrices van de telefonische openbaar vervoer-reisinformatie (OVR) een luisterende en pratende computer als collega, voorlopig alleen voor bellers in de regio Haarlem. In een eenvoudige dialoog kan de computer reizigers informeren over vertrek- en aankomsttijden van treinen.
'Dat is nog de enige manier om bellers snel en adequaat te woord te kunnen blijven staan', aldus Bram Munnik, projectleider spraaktechnologie van OVR. Vorig jaar kreeg OVR veertien miljoen telefoontjes. 'Vier miljoen bellers hingen voortijdig op, omdat ze te lang moesten wachten.'
De digitale reisadviseur wordt ontwikkeld door Philips en KPN Research, bijgestaan door de Technische Universiteit Delft en de Katholieke Universiteit Nijmegen.
Bij het verwerken van de gesproken informatie gaat de reiscomputer stapje voor stapje te werk. De pc - een snelle multimediacomputer - heeft een woordenschat van tweeduizend woorden. De OVR-computer kent de namen van stations in allerlei varianten (Den Haag, Den Haag CS, 's Gravenhage), dagen (maandag, vandaag, overmorgen, 8 augustus) en tijden (drie uur, ongeveer drie uur, tegen drieën, vijftien uur) en zinsconstructies als: 'Ik wil naar. . .'.
Vijftig keer per seconde begint de spraakherkenner van de computer uit te zoeken of de klank die hij opvangt, het begin kan zijn van een bekend woord. Het probleem is dat de computer in feite geen verschil hoort tussen een gesproken woord of geruis. Voor hem is het allemaal geluid.
De opgevangen klanken worden getoetst aan de woordenlijst. Komt zo'n klank ongeveer overeen met een woord op de lijst, dan wordt het woord doorgegeven aan een grammatica-module. Deze zoekt uit of ontvangen woorden in een logisch verband te zetten zijn. Soms gaat het mis. Dan interpreteert de computer 'Ik wil naar Den Haag' als: 'Bestemming Naarden'. Het woord 'Haag' wordt genegeerd.
De beller moet zo'n fout meteen zelf corrigeren. De machine probeert slim te zijn door een zo kort mogelijke dialoog te voeren en vraagt dus niet telkens: 'Klopt het dat. . .?' Dat zou het gesprek te lang maken, vinden de ontwerpers.
De laatste stap is dat de grammatica-module de noodzakelijke gegevens uit de dialoog - vertrek- en aankomststation, datum, tijdstip - doorgeeft aan een elektronische reisplanner. Uit die informatie volgt een gesproken reisadvies voor de beller.
OVR test het systeem deze zomer met een beperkt aantal proefpersonen. Maar ook het publiek mag het nieuwe systeem alvast proberen (070-3040418). Enkele telefoontjes vanuit de redactie maakten duidelijk dat het systeem redelijk goed werkt, alhoewel achtergrondgeluid storend blijkt.
Volgens Munnik van OVR handelt de computer 85 procent van de gesprekken goed af. 'We zijn niet ontevreden, maar de score moet nog wel flink omhoog.' Het gaat volgens OVR voornamelijk nog mis als mensen te onduidelijk spreken, of juist onnatuurlijk keurig. Een accent is geen bezwaar, dialectwoorden wel. 'Een inwoner van de Achterhoek moet even helder te verstaan zijn als een verkouden Amsterdammer of een Surinamer.'
Vijf jaar geleden was spraakherkenning op deze schaal nog vrijwel onvoorstelbaar. Het was toen alleen mogelijk de computer langzaam toe te spreken, met een pauze tussen elk woord. Aangezien computers steeds sneller zijn geworden, kunnen ze tegenwoordig veel intensiever zoeken naar woorden en zinsverbanden.
Maar er is nog een groot obstakel bij spraakherkenning: de achtergrondruis. Een huilende baby of een bellende collega kunnen de dialoog met de computer al verstoren. Verwacht wordt dat er over niet al te lange tijd microfoons zullen zijn die omgevingslawaai kunnen wegfilteren.
Prof. dr. Jan Aasman, sinds kort hoogleraar industrieel ontwerpen aan de Technische Universiteit Delft en werkzaam bij KPN Research, verwacht een 'gouden toekomst' voor pratende en luisterende computers. 'Nu werken veel servicelijnen, zoals de girofoon van de Postbank, nog met voice mail-systemen. Ze geven de beller instructies als: ''Toets 1 voor bijschrijvingen''. Bedrijven zijn er dol op, want ze kunnen 24 uur per dag informatie verschaffen zonder tussenkomst van telefonisten.' Ergonomen zijn er ook dol op, stelt Aasman cynisch vast. 'Ik deed ooit een evaluatie van een telefoonsysteem waarmee je cd's kon bestellen. In zijn complexiteit lag het ergens tussen een adventure game en blind schaken.'
Eén ding staat daarom voorop bij ontwerpers. Communicatie met een luisterende computer mag niet ontaarden in een Babylonische spraakverwarring. De mens moet niet langer leren met de computer om te gaan. De machine moet zich aan de mens aanpassen.
Aasman speculeert over wat er dan mogelijk wordt. 'Wat zou het toch mooi zijn als we de telefoon konden vervangen door een apparaat met maar één knop, een toestel dat we gewoon kunnen vertellen wat we gedaan willen hebben.' Het klinkt misschien futuristisch, erkent Aasman, maar de grote telematica-laboratoria in de wereld zijn druk doende met het herintroduceren van de ouderwetse telefonist. 'Maar dan in de vorm van een pratende computer, de personal call assistant.' Die zoekt zelfstandig op Internet naar informatie, bestelt op verzoek een pizza en regelt desgewenst een blind date.
0ERRE-toekomstmuziek? Een eerste stapje in die richting wordt dit najaar in het mobiele netwerk van PTT Telecom gezet. Voicedialing is een bescheiden personal call assistant. De klant kan met zijn eigen stem namen en bijbehorende telefoonnummers programmeren en kiezen. 'Bel het kantoor' is dan voldoende om verbinding te krijgen.
De grootste uitdaging is volgens Aasman om luisterende computers common sense, gezond verstand bij te brengen. 'Mensen houden zich in gesprekken amper aan de grammatica. We beginnen vaak een zin opnieuw, gebruiken ironie, zeggen ''ja'' terwijl we ''nee'' bedoelen, lachen, kuchen en refereren aan allerlei dingen die we een aantal zinnen eerder gezegd hebben. Een computer snapt daar niets van, want hij verwacht keurige volzinnen. Vooralsnog kan de computer niet met alle kronkels van de spreektaal overweg.' Een volwaardige, vloeiende conversatie met een computer zit er dus voorlopig niet in.
Halverwege de jaren tachtig ontwikkelden PTT en Philips de telefonische inlichtingenmachine Auditel. Het programma kon trefwoorden herkennen en een eenvoudige dialoog voeren op het gebied van sport, financiën en politiek. Auditel kwam niet op de markt omdat het bedrijfsleven er niet van overtuigd was dat er behoefte aan bestond.
Is de consument dan nu wél klaar voor digitale telefonisten en luisterende computers? Volgens prof. dr. Lou Boves, hoogleraar spraaktechnologie aan de Katholieke Universiteit Nijmegen en adviseur bij de ontwikkeling van de OVR-computer, mikken softwareproducenten op de volgende generatie computergebruikers. 'Want hoe mooi het allemaal ook klinkt, het vraagt heel wat inzicht van de gebruiker om een computer al pratend te bedienen.' Volgens Boves is de acceptatie van de pratende reiscomputer onder proefpersonen groot.
'Oudere mensen vinden de technologie moeilijk. Maar het blijkt dat ze toch evenveel kans op een goed afgerond telefoongesprek hebben als bellers uit andere leeftijdsgroepen.'
Praten met de computer is over een paar jaar de normaalste zaak van de wereld, verwacht Munnik van OVR. 'Maar ik geef het toe: als je mensen laat kiezen, dan praten ze liever met een aardige mevrouw dan met een computer.'
Bart Dirks