La reconnaissance vocale en 2019

By Authôt in ateliers — 14 nov. 2019

Pour commencer, rappelons brièvement ce qu’est et en quoi consiste la reconnaissance vocale. Selon Wordreference, souvent « improprement appelée reconnaissance vocale, la reconnaissance automatique de la parole est une technique informatique qui permet d’analyser la parole captée au moyen d’un microphone ». Et c’est notre spécialité chez Authôt.

En fait, si l’on fait un état des lieux de l’utilisation de la reconnaissance vocale en 2019, on observe dans notre quotidien que nous commençons à entendre parler et à utiliser les assistants personnels intelligents pour la maison : Google Home, Amazon Echo, Homepod… qui répondent aux commandes vocales.

Le fonctionnement est le suivant : vous activez leur reconnaissance vocale automatique pour exprimer une requête en démarrant par un mot-clé défini. Par exemple « Ok Google » ou « Alexa… ».

Ensuite, ils envoient votre « fichier audio » contenant la requête orale à leurs serveurs pour les transcrire. Aujourd’hui, la reconnaissance automatique de la parole permet ainsi de répondre à certaines questions des utilisateurs, donner des informations comme les prévisions météo, jouer de la musique et également intervenir en domotique.

L’émergence de la reconnaissance vocale

reconnaissance vocale 2019

La reconnaissance vocale est un sujet travaillé depuis le début du XXème siècle. Puis la révolution des smartphones est arrivée. Notamment avec Siri par Apple.

En effet, SIRI, en tant que premier assistant vocal, a initié un bouleversement pour les systèmes d’exploitation mobile et quant aux usages des consommateurs. Aujourd’hui, Google souligne que plus de 20% des recherches effectuées via son moteur de recherche sont des recherches vocales.

Toutefois, malgré le côté attractif de la recherche vocale, une étude américaine souligne que son utilisation dépend du contexte. En effet, 60% des sondés utilisent la recherche vocale uniquement lorsqu’ils sont seuls chez eux. En public, l’utilisateur ose moins pour le moment. En outre, concrètement dans les usages, la recherche internet n’arrive que sixième dans les actions effectuées par les utilisateurs lorsqu’ils utilisent la reconnaissance automatique de la parole. Majoritairement, la commande vocale est utilisée pour les appels téléphoniques.

Reconnaissance automatique de la parole

A présent, il va s’agir d’expliciter les différentes technologies et utilisations de la reconnaissance vocale.

Tout d’abord, la recherche vocale et la reconnaissance automatique de la parole s’inscrivent dans des problématiques et des investissements marketing. En effet, il apparaît que les entreprises ont tout intérêt désormais à comprendre et à adopter ces nouvelles pratiques du web. Pour tous types de secteurs d’activité, la recherche vocale à un impact. Elle conduit à un changement de paradigme considérable. Elle transforme un peu également les moteurs de recherche en « machines à réponses ». Et cela change tout dans notre rapport à l’information-communication ! En effet, dans ce processus, c’est une intelligence artificielle qui sélectionne des réponses – plus ou moins pertinentes – uniquement parmi les résultats accessibles dans sa base de données.

La technologie Speech to text

Le Speech-to-text est une technologie de reconnaissance vocale qui permet de transformer de manière automatique, de l’oral en texte. Le Speech-to-text est également appelé reconnaissance vocale automatique ou reconnaissance vocale par ordinateur.

En réalité, les logiciels de Speech-to-text – ou discours oral en texte – peuvent être très utiles pour des professionnels qui doivent par exemple écrire beaucoup de textes. La technologie leur permet de gagner du temps en dictant le texte à leur ordinateur. Une dictée ensuite retranscrite à l’écrit.

En outre, le speech-to-text peut également aider les personnes en situation de handicap qui ont des difficultés ou pour qui il est impossible de taper sur un clavier. C’est pourquoi de nombreux systèmes d’exploitation et de logiciels intègrent aujourd’hui directement une technologie de speech-to-text. Par exemple, les smartphones Android offrent la possibilité de dicter oralement des SMS. Sur Microsoft Office, on peut dicter du texte.

Reconnaissance vocale 2019 : notre présence à Voice Tech

Voice Tech Paris - Authôt

En ce mois de novembre 2019, pour la première fois en France, un événement dédié à la reconnaissance et aux technologies vocales a lieu. Il s’agit de Voice Tech Paris. Cet événement réunit tout l’écosystème vocal français. Le but étant d’accélérer la transition conversationnelle des entreprises, d’échanger entre professionnels du secteur, afin de favoriser l’émergence d’une économie vocale en France. Et nous y serons présents.

Voice Tech Paris 2019 se déroulera les 26 et 27 novembre aux « Salons de l’Aveyron » à Paris. Plus de 700 experts sont attendus pour deux jours de conférences, d’ateliers, d’expositions de solutions et produits du marché.

Atelier : Découvrez comment retranscrire et traduire en direct des vidéos, conférences, débats ou cours…

Pour Voice Tech Paris 2019, nous animerons un atelier, le mardi 26 à 13h30, où vous pourrez découvrir comment transcrire et traduire en direct des vidéos, des conférences, des débats ou des cours. Ceci est possible grâce à notre technologie Authôt Live.

Puis, notre partenaire Opsomai livrera son témoignage sur la mise en place et l’utilisation de notre solution.

Au travers de son retour d’expérience, nous parlerons de la reconnaissance vocale au service du sous-titrage vidéo. Soit comment Opsomai intègre la transcription vocale et permet ainsi à ses clients de gagner du temps.

Ce témoignage s’effectuera en deux temps : d’abord avec un retour quant à l’intégration d’Authôt APP ; notre service de retranscription, pour une meilleure indexation de contenus. En outre, l’automatisation du sous-titrage et de la traduction vidéo.

Ensuite, dans un deuxième temps, par extension, comment la transcription a permis aux professionnels de se recentrer sur le cœur de leur métier : avec des coûts et délais de retranscription divisés par deux. Rendez-vous donc le mardi 26 novembre à 16h30 pour assister à ce retour d’expérience.

En somme, le marché de la reconnaissance vocale est en pleine effervescence en 2019. De ce fait, de nombreux acteurs en France et à l’étranger ont déjà saisi le potentiel de ce type de technologies. Ce marché est très prometteur. Il s’agit d’un mode de recherches et d’interactions naturelles, en passe d’être adopté en masse.

Pour en savoir plus sur Authôt Live, Authôt APP et/ou nos autres services, n’hésitez pas à nous rejoindre sur notre stand afin d’échanger sur vos problématiques liées à la Reconnaissance Vocale.

tester l'application Authôt

Authôt. Vous parlez. Nous écrivons.