Logiciel de reconnaissance vocale : Pourquoi en avons-nous besoin ?

logiciel de reconnaissance vocale

 


La reconnaissance automatique de la parole, qu’on appelle plus grossièrement reconnaissance vocale a toujours suscité beaucoup d’imagination. Dans un premier temps, elle est bien entendu évoquée en tant que formule magique : un son de notre part entraine une action prodigieuse. C’est notamment le cas d’Ali Baba qui s’approprie les richesses d’une bande de voleurs grâce à la célèbre formule : « Sésame, ouvre-toi », qui ouvre un passage à travers leur grotte.

Maintenant, la magie est devenue technologie et la reconnaissance vocale est à la portée de tous. De la simple satisfaction de gagner du temps à l’excitation de commander un objet à distance, la reconnaissance vocale connait ses premiers émois en 1952, date à laquelle un système électronique (qu’on ne peut même pas encore qualifier d’ordinateur !) réussira à reconnaître une série de dix chiffres.

Depuis, les applications de reconnaissance vocale ont bien évolué. Une grande partie des smartphones en sont dotés pour effectuer des recherches sur internet et la technologie ne cesse de se perfectionner.

Quelle technologie ? Comment fonctionne un logiciel de reconnaissance vocale ?

Littéralement voici ce que ça donne…

Reconnaissance vocale : conversion de la voix en fichier numérique qui permet de décoder un signal acoustique de parole en une suite de mots effectivement prononcés.

Aussi barbare que soit cette phrase, elle n’en ait pas moins vraie. Voici le processus simplifié que suit la reconnaissance vocale :

Suite à l’enregistrement d’une phrase par un microphone, un logiciel analyse la voix pour en extraire des données numériques, seule façon de pouvoir dialoguer de manière cohérente avec un ordinateur. Une phase d’identification débute alors pour retranscrire la parole en texte. Le logiciel demande à un dictionnaire d’identifier ses données pour sélectionner les mots en adéquation et les proposer à l’utilisateur. La qualité d’un logiciel de reconnaissance vocale résidera dans sa capacité à retranscrire une phrase en adéquation avec le fichier audio et cohérente dans le texte. Il est important de remarquer qu’un dictionnaire contenant un lexique conséquent est un véritable plus dans le processus d’identification. De nombreux mots peuvent ne pas être pris en compte au début. La plupart des logiciels aujourd’hui disposent donc d’un dictionnaire qui peut être enrichi. Dans ce cas, une phase d’apprentissage pour ce dernier sera utile, voire nécessaire afin de proposer le meilleur contenu. Cette phase, on peut aussi la retrouver à l’enregistrement de la voix. Le logiciel, au fur et à mesure qu’il est utilisé par la même voix, la comprend de mieux en mieux.

Une application de reconnaissance vocale pourquoi ?

Certains y voient simplement un gadget : un outil plus amusant pour chercher du contenu en ligne via son smartphone, une solution plus fun de contrôler sa console de salon (Xbox One – Kinect) ou un moyen plus pratique d’écrire des sms à sa mère (au-delà de l’aspect gadget, on notera l’utilité pour écrire un texto au volant !)

Mais ce n’est pas tout. Dans le milieu professionnel, la reconnaissance vocale est une technologie de plus en plus recherchée. En médecine par exemple, un médecin peut l’utiliser pour renseigner plus facilement et plus rapidement un dossier patient. Les médias peuvent transcrire leurs fichiers audio ou vidéo pour être mieux référencés dans les moteurs de recherche. Les productions audiovisuelles peuvent épargner du temps de transcription manuelle pour les sous-titres. Les institutions académiques peuvent rendre leurs cours plus accessibles en sous-titrant un MOOC ou en donnant un script à un étudiant qui ne pourrait pas se déplacer dans la salle de classe. Les étudiants eux-mêmes peuvent trouver une utilité dans une application de reconnaissance vocale. La retranscription d’entretiens peut prendre énormément de temps, en particulier pour quelqu’un qui rédige un mémoire ou une thèse.

Les applications de la reconnaissance vocale sont multiples. La demande de retranscription grandit. Des solutions existent.

Authôt s’est servi de cette technologie pour créer un logiciel en ligne simple et intuitif. Grâce à la reconnaissance vocale, l’utilisateur télécharge son fichier audio ou vidéo sur la plateforme Authôt qui le retranscrit automatiquement. Il ne reste plus qu’à corriger le texte ainsi généré et à l’exporter sous le format que l’on souhaite (docx, srt,…).

 L'application de reconnaissance vocale Authôt est disponible sur app.authot.com. Version d'essai gratuite.

tester l'application Authôt