« Parmi tous les services hébergés par Microsoft, c'est la reconnaissance vocale qui mobilise l'un des plus gros systèmes cloud de l'entreprise, » a déclaré Zig Serafin, directeur général des applications voix chez Microsoft. Celui-ci concerne aussi bien les services de réponse vocale utilisés par les lignes téléphoniques des services clients de grandes entreprises comme Orbitz ou American Airlines, que la technologie permettant aux utilisateurs mobiles d'utiliser la voix dans le moteur de recherche Bing ou encore aux abonnés de Ford Sync d'obtenir des informations routières. C'est avec l'acquisition de Tellme en 2007 que Microsoft s'est immiscé sur ce marché. A l'époque, la reconnaissance vocale était dans l'air depuis des années, mais sans faire preuve de résultats probants en terme de fonctionnement. « Essayer d'utiliser une partie du logiciel embarqué sur un téléphone mobile était une épreuve, même quand on était dans un endroit tranquille, » a déclaré Will Stofega, analyste chez IDC.



Zig Serafin, directeur général des applications voix chez Microsoft

« Mais la technologie a suffisamment évolué pour que, sur l'ensemble des moteurs de recherche mobiles gérés par Microsoft, 20% soient maintenant accessibles par la voix, » a indiqué Microsoft. Via le cloud, l'éditeur recueille aussi des informations sur la manière dont les gens utilisent le service et s'en sert pour l'améliorer. Par exemple, si un utilisateur dit sur son mobile tournant sous Windows Phone 7 « Seattle restaurant italien » dans Bing, la firme sait si l'utilisateur clique sur un résultat, ce qui signifie qu'il a obtenu la réponse souhaitée. A l'inverse, l'utilisateur peut être amené à énoncer plusieurs fois sa requête vocale, indiquant peut-être que le service de Microsoft n'a pas bien identifié la demande. L'éditeur recueille également des informations sur la qualité de la connexion, pour estimer si elle peut être responsable des mauvais résultats. « Ces informations sont précieuses pour aider à améliorer la technologie sous-jacente du système », a déclaré Zig Serafin.

Un service également proposé par Google

Google permet également à ses utilisateurs d'effectuer des recherches par la voix et propose différentes offres mettant en oeuvre la reconnaissance vocale. L'entreprise fait aussi du traitement en back-end pour observer la façon dont les gens utilisent ses services. Pour sa part, Microsoft, qui a de multiples produits utilisant la reconnaissance vocale, dit traiter environ 11 milliards de requêtes « voix » par an. Sur les appareils tournant sous Windows Phone 7, les utilisateurs ont juste à appuyer sur le bouton Accueil pour lancer la fonction voix, laquelle permet de contrôler de nombreuses applications sur ces mobiles. L'énorme volume de données relatif à l'usage de la reconnaissance vocale est dirigé vers un centre d'opérations situé dans la Silicon Valley. «L'afflux de requête est tout simplement fascinant, » déclare Zig Serafin. « On se croirait dans un laboratoire de la NASA. » Certaines fonctions de la boucle de feedback sont automatisées de sorte que le moteur de reconnaissance vocale est capable d'analyser lui-même les données, » explique-t-il. « Mais certaines informations sont examinées de plus près par des experts qui peuvent ensuite apporter des modifications au système, » ajoute-t-il.