De slimheid van spraaktechnologie

Artificial intelligence

Puppycursus met je computer

Head of imagination, zo staat zijn functie bij Telecats beschreven in Linkedin. Een tekort aan verbeelding, daar kun je Arjan van Hessen als onderzoeker in spraaktechnologie niet van beschuldigen. Bij de universiteit en bij het bedrijf Telecats onderzoekt hij nieuwe toepassingen van spraaktechnologie. Spraak licht Arjan graag toe met een metafoor: het trainen van een computer is als het trainen van een hond. Je kunt tegen de hond zeggen: haal de vogel op. En na verloop van tijd kan dat resultaat opleveren. Maar daarmee spreekt de hond nog geen mensentaal. Zo is het met de computer ook. Je besteedt tijd om hem te instrueren voor een gewenste uitkomst. En die uitkomst is herhaalbaar. Maar dat maakt de computer nog niet automatisch intelligent. Als je een jonge hond bekijkt in zijn gedrag, dan zijn dit eigenlijk zelflerende apparaten. Als je niet teveel ingrijpt leert hij zichzelf poepen en plassen. Ze halen echter niet vanzelf een fazant op. Daar moet je ze voor trainen. Dat doe je door gewenst gedrag te belonen. Met de logica van reïnforced learning kun je de computer belonen, door zoveel mogelijk punten te laten verzamelen, behorend bij een gewenst doel. Dat is op dit moment de meest geavanceerde tak van AI.

Voice AI, de stand van zaken

Spraakherkenning is op dit moment al bijna 100%, er zijn alleen nog wat hobbels met interpunctie. Ook qua begrip gaat het hard. Op de reading comprehension test van Stanford scoort een gezamenlijke techniek van Alibaba en Microsoft inmiddels beter dan de mens.

iFLYTEK & HIT Reading Comprehension Model Betters Humans, Tops SQuAD2.0 Leaderboard

Voice AI is erg volwassen wanneer het gaat om horen wat mensen zeggen en herkennen van emoties, zoals verdriet, boosheid, angst en vreugde. Voice AI is minder goed in het begrijpen van mensen en het herkennen van fijnkorrelige emotie, zoals sarcasme of verbazing. Een uitdaging is bijvoorbeeld het verschil tussen “gisteren is de vorst ingevallen” en "gisteren is de vorstin gevallen”. Als iemand een verschrikkelijk vet feest beschrijft, dan heeft de computer moeite om dit te interpreteren.

Samenvattend is de intelligentie in spraak nu nog beperkt. En tegelijkertijd worden er belangrijke stappen voorwaarts gezet. Dat a.s.r. er nu niet voor kiest om gehaast een zwakke voice case in de markt te zetten, vindt Arjan verstandig. Die tijd die de technologie nodig heeft om nog beter te worden, die kun je mooi benutten om vast te stellen wat je er precies mee wilt bereiken.

Meer lezen?

"Hey I&D, wat is voice?"

Lees verder

Powered by Foleon

Artificial intelligence