Facebook IA : la traduction automatique sans passer par l’anglais
La traduction est un processus bien plus complexe qu’il n’y paraît. Nous vous en parlons régulièrement sur notre blog. Après avoir mis face à face la traduction humaine et la reconnaissance automatique de la parole, vous avoir expliqué comment marche la traduction pour les entreprises ou encore vous avoir présenté notre service de sous-titrage et de traduction de vidéos en ligne pour tous, abordons une nouveauté ! En effet, Facebook IA a développé un outil de traduction automatique sans passer par l’anglais…
Facebook IA : un système puissant de traduction automatique
Tout d’abord, il faut comprendre que l’intelligence artificielle de Facebook – ou Facebook IA – est un système interne de reconnaissance des contenus sur le célèbre réseau social. Rappelons brièvement ce qu’est une intelligence artificielle.
Selon college-de-france.fr, l’intelligence artificielle est « un ensemble de techniques permettant à des machines d’accomplir des tâches et de résoudre des problèmes normalement réservés aux humains ».
De ce fait, il est tout à fait logique que Facebook – en maître des contenus sur les réseaux sociaux – travaille aux traductions internes de sa plateforme.
Ainsi, en lançant un système de traduction automatique sans passer par l’anglais, Facebook fait très fort ! C’est une nouvelle qui nous provient de différents médias : Facebook aurait créé l’une des IA en traduction les plus puissantes au Monde !
En effet, selon siècledigital.fr, contrairement à « la majorité des traducteurs, cette nouvelle intelligence artificielle développée par Facebook ne s’appuie pas sur les données de la langue anglaise »… Ce qui est un bouleversement considérable dans le secteur !
Le réseau social Facebook vient de dévoiler M2M-100, le premier modèle de traduction automatique multilingue – MMT. Grâce à son intelligence artificielle, M2M-100 peut traduire un contenu dans près de 100 langues vivantes, et ce sans se baser sur les données de la langue anglaise.
Facebook promet ainsi d’ « améliorer la qualité des traductions pour des milliards de personnes ». En effet, car selon Facebook, l’un des plus grandes difficultés pour « construire un modèle de traduction multilingue est de réunir de grands volumes de pairs de phrases de qualité entre langues qui ne transitent pas par l’anglais ».
La force de l’intelligence artificielle de Facebook pour la traduction automatique
La force de l’intelligence artificielle de Facebook pour la traduction automatique réside dans son expérience, son entraînement.
Lemondeinformatique.fr souligne que « M2M-100 est entraîné sur un total de 2 200 directions linguistiques, soit 10 fois plus que les meilleurs modèles multilingues centrés sur l’anglais, cela peut ainsi améliorer la qualité de traduction […] et en particulier sur les langues pour lesquelles il existe peu de ressources ».
Quelle que soit la langue vivante choisie, le modèle s’entraîne directement sur les données de la langue source. Ensuite, il fait directement la passerelle avec la langue souhaitée.
Angela Fan, assistante de recherche à Facebook IA, explique ainsi qu’en utilisant ce modèle, « après évaluation par l’algorithme BLEU – Bilingual Evaluation Understudy – le modèle dépasse de 10 points les systèmes centrés sur l’anglais ».
Ce qui est parfaitement compréhensible !
Le BLEU – ou évaluation bilingue en cours d’étude – analyse la qualité des traductions automatiques.
Grâce à de tels systèmes, cela améliore considérablement l’accès aux informations à l’échelle du globe. D’ailleurs, Facebook rappelle que près de 20 milliards de traductions se font chaque jour sur le fil d’actualités du réseau social.
Facebook IA : un système entraîné pour obtenir ces résultats
En fait, pour parvenir à un tel modèle, les scientifiques de Facebook ont d’abord passé plusieurs années à récolter près de 7,5 milliards de phrases traduites dans différentes langues afin d’entraîner l’intelligence artificielle. 15 milliards de paramètres sont pris en compte.
Ensuite, FastText – un système de classification de textes également développé par Facebook – a permis d’identifier les langues correspondantes aux textes.
Troisièmement, le protocole de minage LASER a lui repéré automatiquement des phrases traduites en différentes langues.
« LASER lit les phrases, prend les textes et crée une représentation mathématique de ces derniers, de sorte à ce que les phrases qui ont la même signification, correspondent à la même pensée. ». – Angela Fan, assistante de recherche pour ce projet.
Ce qui en fait un système à la fois évident et pourtant très complexe !
En fait, Facebook IA représente un jeu de 7,5 milliards de paires de phrases pour 100 langues étrangères différentes. Et plus le nombre de langues est important, plus le volume de données nécessaires à l’entraînement du modèle l’est aussi.
S’il faut 10 millions de paires de phrases pour chaque direction, il faut en traiter 1 milliard de paires pour 10 langues et 100 milliards de paires pour 100 langues.
Par ailleurs, fort de ses nombreux travaux sur les langues et en traduction, sachez que Facebook IA a aussi publié sur arxiv.org ses recherches afin d’améliorer la reconnaissance automatique de la parole pour plus de 50 langues vivantes.
Les usages de M2M-100
Désormais, les usages de M2M-100 sont tous trouvés ! Grâce à la puissance de ce système qui ne passe plus par l’anglais, le réseau social de Mark Zuckerberg va commencer par améliorer les usages et la qualité des échanges à l’international à travers les traductions instantanées disponibles sur sa propre plateforme.
Néanmoins, siècledigital.fr, rappelle qu’avant d’en arriver à un déploiement à grande échelle , le « modèle de traduction automatique multilingue devra encore se soumettre à plusieurs tests de conformité ».
Disponible en open-source, M2M-100 est un outil puissant qui devrait encore surprendre !
Fonctionnement des outils actuels de traduction
Pour comprendre cette révolution numérique, revenons sur le fonctionnement des outils actuels de traduction.
Jusqu’à maintenant, la plupart des modèles multilingues instantanés s’appuient sur des data de la langue anglaise pour effectuer les traductions. Par exemple, pour traduire du chinois en français, les outils de traduction vont commencer par faire un cheminement du chinois à l’anglais, avant de passer de l’anglais au français.
Le problème c’est que ce procédé aboutit à des traductions souvent hasardeuses, imprécises, contextuellement un peu à côté.
C’est pourquoi, le département de recherche en intelligence artificielle – IA – de Facebook a voulu pallier ce problème. Grâce à M2M-100, ce modèle de traduction multilingue peut traduire 100 langues entre elles. Et surtout, on passe d’une langue à une autre sans se référer à l’anglais.
Les résultats sont sans appel : les traductions obtenues par M2M-100 sont bien plus justes et précises qu’auparavant.
La traduction chez Authôt
Chez Authôt, la traduction, cela nous connaît ! C’est une thématique que nous surveillons de près ! En effet, nous proposons notre expertise depuis 2012 en transcription automatique ou avec relecture humaine, sous-titrage et traduction. Nous allions la technologie du Speech to Text avec l’expertise humaine car nous connaissons les tenants et aboutissants pour des traductions optimales.
Pour traduire les sous-titres de vos contenus – audios et vidéos -, nous proposons nous-mêmes un service de traduction avec plus d’une centaine de combinaisons de langues.
Nous travaillons avec une centaine de professionnels dans les différentes langues proposées. Ce sont des dactylographes, rédacteurs ou traducteurs natifs des pays en question.
En somme, ce système de traduction automatique sans passer par l’anglais de Facebook IA, montre bien l’intérêt d’utiliser la technologie pour la traduction. Cependant, la vérification humaine est primordiale ! Si vous souhaitez bénéficier de l’expertise de nos traducteurs pour votre média, votre entreprise, votre Ecole, n’hésitez pas à nous contacter !
Authôt. Vous parlez. Nous écrivons.