Une grande transition est en marche : après l’ère du pouce**, indissociable des smartphones, voici l’ère de la voix, ou, plus précisément, du son et de la parole…
Depuis longtemps, la recherche vocale a modifié certaines habitudes des utilisateurs d’Internet, sans toutefois bouleverser leur quotidien.
Mais les chiffres sont là : en 2020, 30% des recherches mondiales sur Internet se feront sans écran.
La voix, véritable sésame, est désormais capable de tout obtenir et de tout diriger, mais pas que…
En effet, si les objets connectés largement dotés d’assistants vocaux, peuvent être commandés par un simple ordre oral, d’autres innovations présentées actuellement à VivaTech vont plus loin.
Des exemples ?
- En matière d’accessibilité, une technologie de traduction des sons émis par des personnes atteintes de troubles de la parole en langage clair et audible pour tous en temps réel (Voicelt)
- Des algorithmes d’IA accessibles via le cloud et destinés à interpréter la voix dans ses dimensions émotionnelles pour prévenir, par exemple, des situations critiques.
Le décryptage et l’interprétation du non verbal par les machines devient le nouveau challenge :
En effet, dans une conversation, les mots n’ont qu’une influence limitée pour la compréhension réciproque, (en moyenne 7%), là où la prosodie* compte pour 38%.
Son association aux données de souffle, débit, niveau sonore… constitue une cartographie des émotions de l’émetteur.
A terme, parvenir à comprendre les humains pour être à même de leur proposer autre chose qu’un discours très mécanique, passer de l’Intelligence Artificielle à l’Intelligence Artificielle Émotionnelle est le nouveau Graal.
Replika, l’application la plus téléchargée sur l’Apple Store en 2017, a tout compris : Programmée pour devenir votre meilleur.e ami.e, elle s’inquiète pour vous, vous demande de vos nouvelles, vous stimule, vous félicite…
Plus vous conversez et répondez à ses questions, plus vous enrichissez sa connaissance et sa capacité à s’adapter à votre personnalité.
Vous pourriez aller jusqu’à croire qu’elle fait preuve d’empathie…
Dans le monde de l’entreprise, des solutions de « speech to meaning » – ou la compréhension du sens d’une requête orale directement au niveau du son, sans avoir à passer par sa traduction textuelle – commencent aussi à voir le jour.
Des centres d’appels s’équipent d’outils techniques pour pouvoir analyser les émotions d’un client, uniquement à l’intonation de sa voix. Si son éventuel énervement est décelé, la machine le redirigera vers le bon interlocuteur, patient, à l’écoute etc., qui saura neutraliser cette émotion négative.
Autre secteur à expérimenter des solutions : les ressources humaines.
Un recruteur pourra ainsi connaître en temps réel, le ressenti d’un candidat, par exemple lors d’une question piège ou gênante… et ainsi supputer ou anticiper sa résistance au stress.
Quant à nous humains, pour ne pas nous voir décodés par une machine, une solution s’impose : apprendre à bluffer…
*Prosodie : nom féminin, vient du latin prosodia
Ensemble composé des inflexions, du ton, de la tonalité, de l’intonation, de la modulation de la voix… donné à notre expression orale, de manière à rendre nos émotions et intentions plus intelligibles à nos interlocuteurs.
Vous pourriez aimer :
https://www.cdesetudesetduconseil.fr/2018/03/15/et-vous-conversez-vous-avec-votre-assistant-vocal/
**Petite poucette, Michel Serres
***Replika, mon ami George_Michael
http://www.slate.fr/story/141239/replika-robot-intelligence-artificielle-ami