Le rôle des phonèmes et du langage dans la reconnaissance vocale
Les phonèmes et l’étude du langage
En tant qu’acteur proposant de la retranscription de la parole en texte, nous avons choisi de revenir sur la formation du langage. L’idée est de comprendre comment une langue se construit pour saisir, par la suite, le fonctionnement la technologie de la reconnaissance vocale.
La linguistique est la discipline de l’étude du langage qui comprend différents domaines d’analyse complémentaires, dont la phonologie et la phonétique :
- La phonologie est la branche de la linguistique qui étudie l'organisation des sons au sein des différentes langues naturelles. Elle s’intéresse aux sons en tant qu’éléments d'un système.
- La phonétique, quant à elle, s'intéresse aux sons en tant qu'unités acoustiques produites par un mécanisme physiologique, indépendamment de leur emploi.
La phonétique donne une description très précise des sons, mais aucun son n’est identique. La variété des sons produits par un locuteur d'une même langue est pratiquement infinie.
Par exemple le son [i] est différent s'il est prononcé par un homme ou par une femme, et peut être différent aussi chez la même personne en fonction des moments (émotion, rhume).
Dans le cadre de l’analyse du langage, nous pouvons alors nous demander : comment nous arrivons à nous comprendre, c'est à dire comment les sons peuvent être perçus correctement malgré les différences de timbres et d'intonations ?
La réponse apportée par la phonologie est que le langage ne retient pas toutes les différences de son, il retient seulement les différences de sons pertinents dans le système linguistique, les différences significatives. Nous pouvons alors parler de fonction.
Le son [i] en français remplit la même fonction quel que soit le locuteur et la prononciation, il correspond au phonème /i/.
Le Larousse définit un phonème comme un élément minimal, non-segmentable, de la représentation phonologique d'un énoncé, et dont la nature est déterminée par un ensemble de traits distinctifs.
Dans notre article précédent « Apprentissage des langues avec le sous-titrage », nous avons vu que les langues du monde entier utilisent des phonèmes différents. C’est ce qui complexifie l’apprentissage de nouvelles langues.
Le phonème est la plus petite unité permettant de distinguer des mots les uns des autres. En linguistique, on parle d’unité distinctive de prononciation. Les phonèmes sont représentés par des lettres placées entre des barres obliques: /a/, /t/, /ʁ/, etc. , selon la règle un phonème = un symbole.
Il existe 36 phonèmes classiques en français : 16 voyelles + 3 semi-consonnes + 17 consonnes.
Passer de l’oral à l’écrit
Certains phonèmes sont phonétiquement très proches, si bien qu’un élève qui ne maîtrise pas (ou mal) les difficultés de la langue orale, risque fort de réaliser des erreurs de transcription graphique ou d’orthographe.
La référence de l’apprenant sera ce qu’il « entend dans sa tête » lorsqu’il décompose le mot à écrire, or, s’il prononce de façon erronée, il transcrira ce qu’il « entend ».
La prononciation d’un son ou l’assimilation des phonèmes peut donc poser des problèmes en orthographe. Cela peut également compliquer la reconnaissance automatique de la parole ou reconnaissance vocale.
Dans Parole et dialogue homme-machine de W. Minker et S. Bennacef, les auteurs expliquent que la reconnaissance automatique de la parole est un domaine complexe, car il existe une différence importante entre le langage formel, qui est compris et utilisé par les machines, et le langage naturel, que les humains utilisent. Le langage formel est structuré par des règles syntaxiques strictes et sans ambigüité. À l'inverse, dans le langage naturel, des mots ou des phrases peuvent avoir plusieurs sens selon l'intonation du locuteur ou le contexte.
Certaines erreurs de transcription humaine ou machine peuvent être causées par une mauvaise maîtrise phonologique du langage. Nous pouvons donc dire que la qualité de la retranscription de la parole en texte dépend du langage utilisé par le locuteur (prononciation, intonation).
Le fonctionnement de la reconnaissance vocale permettant la retranscription automatique d’Authôt, sera présenté dans un prochain article, restez connectés ! 🙂
Authôt : Vous parlez. Nous écrivons.