Speech-to-Text et vidéo : usages professionnels et personnels

By Authôt in artificial intelligence — 2 déc. 2021

Le Speech-to-Text est la spécialité d’Authôt, nous surveillons les actualités, nouveautés autour de cette thématique de près. Ici, nous nous penchons sur l’intervention du Speech-to-Text en vidéo. Quelles sont les différences entre des usages professionnels et personnels dans ce processus… En effet, des entreprises, logiciels reconnus comme Adobe Premiere Pro incluent désormais une fonctionnalité de Speech-to-Text à leur plateforme. C’est crucial pour les chefs de projet en agence de production digitale, les monteurs vidéo professionnels. En outre, pour les amateurs qui ont compris l’intérêt de créer des vidéos en marketing. Comme les sous-titres, les transcriptions s’appuient sur la reconnaissance vocale et le speech-to-Text, nous recommandons d’avoir une certaine expertise. Il ne suffit pas de savoir faire de la vidéo… Les enjeux pour le Speech-to-Text et la vidéo sont beaucoup plus complexes qu’il n’y paraît.

tester l'application Authôt

Speech-to-Text, vidéo et Authôt

Pour commencer, qu’est-ce que le Speech-to-Text ? Le Speech-to-Text – ou reconnaissance vocale, transcription vocale – convertit une voix, un fichier audio, en écrit, en fichier texte. Cette technologie permet de ne pas avoir à recopier des propos, à gagner du temps. De plus, à pouvoir directement travailler sur des textes, à les partager.

Chez Authôt, nous proposons deux plateformes de transcription automatique – avec aussi un service de relecture professionnel. Notre première plateforme de transcription automatique et de sous-titrage se nomme Authôt App. À partir de vos fichiers audio et vidéos, vous avez accès en quelques minutes aux transcriptions. Si la qualité du « speech » est bonne, notre solution, qui a largement fait ses preuves depuis des années, est fiable à 95% !

Notre deuxième plateforme, Authôt live, est une plateforme en ligne pour transcrire vos événements en direct. Vos visioconférences sont ainsi directement sous-titrées, transcrites en un temps record… Notre système reposant sur le Speech-to-Text est de plus en plus rapide et performant. En outre, il répond à tous types d’événements, d’activités et de structures. Cette solution répond ainsi à la fois à des besoins et usages personnels et professionnels.

L’importance est telle aujourd’hui que beaucoup d’entreprises s’intéressent à l’audio, la vidéo et à la transcription. Les volumes en transcription, sous-titrage sont de plus en plus nombreux. Non maîtrisé, cela reste complexe.

Speech-to-Text et Adobe Premiere Pro

Pourquoi le Speech-to-Text vient s’immiscer dans des logiciels de montage vidéo comme Adobe Premiere Pro ? Le Speech-to-Text s’intègre petit à petit à Adobe Premiere Pro car cela permet d’offrir une expérience vidéo complète, accessible. De pouvoir directement – tout en montant sa vidéo – s’assurer que celle-ci sera également diffusable textuellement parlant etc.

Ainsi, de quelle manière la technologie du Speech-to-Text s’intègre à un logiciel vidéo ?

Selon helpx.adobe.com, la fonctionnalité « transcription de Premiere Pro est un workflow intégré qui vous permet de générer automatiquement une transcription de votre séquence et de créer des sous-titres personnalisables pour vos vidéos ». Cette fonctionnalité de transcription est disponible en anglais, mandarin, espagnol, allemand, français, japonais, portugais, coréen, italien, russe et hindi. Dans toutes les langues actuellement disponibles, la qualité du Speech-to-Text est satisfaite et les erreurs facilement corrigeables.

Comme chez Authôt, la fonctionnalité Speech-to-Text – transcription – d’Adobe Premiere pro, utilise l’intelligence artificielle et le machine learning. Cependant, la fiabilité est moins importante. De plus, vous devez vous occuper de toute la gestion des sous-titres, de la transcription, des formats et de l’exportation vous-mêmes.

tester l'application Authôt

Des améliorations en développement pour le Speech-to-Text sur Adobe

Concrètement, à l’heure où nous écrivons ces lignes, des améliorations sont en développement pour le Speech-to-Text sur Adobe… En effet, selon le blogdumoderateur.com, la nouvelle version « des applications vidéo d’Adobe, Premiere Pro et After Effects, vous apportent un gain de temps considérable grâce à des fonctions automatisées ».

Notamment le Speech-to-Text amélioré ! En effet, parmi les nouveautés récentes dans Premiere Pro, la fonctionnalité Speech to text vient d’être mise à jour. Dans le cadre de la nouvelle version bêta de Premiere Pro, des améliorations se notent pour la partie transcription. Vous pouvez transcrire une séquence vidéo, tout en personnalisant les légendes.

Si le Speech-to-Text se travaille par Adobe, ce n’est pas par hasard. Cela montre la nécessité et la perfectibilité du processus. Cela ne s’improvise pas. De plus, même si Adobe est un acteur reconnu en audio-visuel, la transcription requiert des connaissances techniques profondes. Notamment en traitement sonore, linguistique et intelligence artificielle. Ainsi, selon 45secondes.fr, Adobe Premiere Pro « dispose désormais de la fonction Speech-to-Text […] la fonctionnalité aide les gens à gagner du temps jusqu’à 75% ». Cela aide donc en grande partie mais cela ne fait donc pas tout le travail non plus… !

Speech-to-Text : améliorations et usages professionnels

Cette fonctionnalité artificiellement intelligente, doit se peaufiner dans le temps. Comme le précise frandroid.com, l’automatisation de la transcription sur Adobe Premiere Pro permet donc de réduire de 75% le temps nécessaire pour créer une transcription et des sous-titres sur une vidéo de 5 minutes ».

C’est à la fois beaucoup et peu ! Surtout pour des usages professionnels en vidéo ! En effet, les vidéos marketing, professionnelles, sont souvent beaucoup plus longues. De plus, les entreprises n’ont souvent pas les ressources internes nécessaires pour corriger de mauvaises transcriptions, sous-titres. Les monteurs vidéo standards ne sont pas formés en ce sens… Qui plus est, la fonctionnalité « Speech-to-Text » d’Adobe Premiere Pro – uniquement disponible en anglais – requiert aussi un abonnement Premiere Pro ou Creative Cloud.

Si vous êtes anglophone et que vous utilisez Adobe Premiere Pro pour votre usage personnel, vous pouvez pourquoi pas utiliser cette fonctionnalité de Speech-to-Text pour vos vidéos… Néanmoins, pour un usage francophone, complet et expert, de meilleures solutions sont envisageables.

La technologie du Speech-to-Text n’en est qu’à ses débuts… Pour améliorer et professionnaliser le processus, il faut allier technologie et humain… En attendant qu’Adobe rende cette fonctionnalité partout et surtout pour ne pas perdre en temps et en professionnalisme, n’hésitez pas à vous appuyer sur l’expertise d’Authôt !

tester l'application Authôt

Authôt. Vous parlez. Nous écrivons.