Formatos de archivo disponibles para exportar una transcripción automática
Última actualización: 16/08/2018
¿En qué formatos de archivo se puede exportar una transcripción automática?
Obtener y descargar una transcripción automática es posible con Authôt. Una variedad de formatos de archivo de descarga están disponibles para cubrir las diferentes necesidades de nuestros usuarios, ya sean formatos de texto, timecode, html u otros.
En este artículo detallaremos cuáles son los formatos disponibles para exportar la transcripción automática que obtiene usando Authôt .
Antes que todo, le recordamos cómo puede transformar su audio o vídeo en texto. Imaginemos que usted desea la transcripción de su archivo audiovisual, por lo cual se dirige a nuestra plataforma de transcripción automática. Estando allí sube su archivo (ver artículo sobre formatos compatibles) y espera unos minutos para que el sistema le dé su transcripción. Seguidamente, lo edita en línea y corrige para finalmente exportarlo (ver tutorial). ¿En qué formatos puede descargar su audio ya transcrito?
Diferentes formatos de archivos para diferentes usos
1) Los formatos de archivos de texto .txt y .docx
Los textos en el alfabeto europeo están formados por caracteres definidos (letras, signos de puntuación, etc.). Un archivo “texto” es, entonces, un archivo cuyo contenido representa únicamente una serie de caracteres.
El formato de archivo .txt propuesto por la aplicación permite exportar la transcripción obtenida en texto bruto. Puede abrirse en el bloc de notas, por ejemplo. Le permite obtener fácilmente su transcripción.
El editor de texto de la aplicación Authôt le permite de ajustar su texto (subrayar, poner en negrita, alinear, agregar títulos, estructurar en párrafos, etc.
Asimismo, es posible trabajar su texto directamente en el editor en línea y seguidamente exportarlo en el formato .docx. Este formato contrariamente al de “texto”, permite guardar los estilos y ser abierto con el software Word. Esta opción le permite entonces ganar tiempo gracias a este formato enriquecido.
Los formatos de texto permiten obtener una transcripción en versión bruta o trabajada, directamente en el editor en línea.
Ello puede especialmente resultarle interesante si trabaja para una empresa o una institución que desea obtener la transcripción de sus reuniones. Los nombres de los participantes pueden agregarse en la transcripción de ser necesario.
2) Los formatos de archivo de subtitulado .srt .webvtt
Primeramente, conviene saber que un archivo de subtitulado está compuesto por dos tipos de información:
- el texto a mostrar
- el tiempo inicial y final por cada línea de texto.
El formato .srt puede ser abierto con el editor de texto Sublime text (ver imagen abajo). Asimismo con el programa Aegisub en el caso de necesitar retrabajar la sincronización entre los subtítulos y el vídeo.
Ejemplo de archivo .srt exportado con Authôt.
Disponible para exportar una transcripción automática.
Disponible para exportar una transcripción automática.
El formato de un archivo .webvtt permite también el subtitulado. Las principales diferencias con el formato.srt son:
- La primera línea empieza por WEBTV como encabezado, seguido por una línea en blanco.
- Las unidades fraccionarias para el tiempo están separadas con un punto y no con una coma.
- Las unidades en las horas son opcionales.
- La identificación para cada unidad de subtítulo que precede el código para el tiempo es opcional.
Los formato de archivo de subtitulado son ahora esenciales para las empresas que regularmente publican vídeos cortos en las redes sociales (ver ejemplo Condé Nast). En efecto, la práctica de autoplay en Facebook e Instagram, demanda que los vídeos estén subtitulados para así asegurar una mayor visibilidad.
Por otro lado, en plataformas como YouTube, el contar con vídeos subtitulados favorece la internacionalización de dicho contenido audiovisual.
Vale destacar en este punto que Authôt ofrece igualmente: la sincronización, la incrustación y la traducción. Los subtítulos pueden, entonces, hacerse en otros idiomas.
Los formatos de archivo de subtitulado se están usando también en el sector educativo, sobre con la oferta en ascenso de MOOCS, así como una valiosa herramienta en favor de la accesibilidad digital en las instituciones públicas.
Por tanto es importante respetar ciertas reglas si usted desea realizar un vídeo subtitulado accesible y de calidad. Por ejemplo:
- Máximo 37 caracteres por línea (puede llevarse a 40).
- De 12 a 15 caracteres en función de la duración del subtitulado con una tolerancia de 20%.
- No más de dos líneas de subtítulos.
-
Respetar los códigos de colores es necesario para cumplir con las normas de accesibilidad en los canales de televisión:
- blanco: locutor visible en la pantalla (aún parcialmente);
- amarillo: locutor no visible en la pantalla (fuera de campo);
- rojo: indicaciones sonoras;
- magenta: indicaciones musicales y letra de canciones;
- cyan: pensamientos de un personaje o de un narrador en películas de ficción, comentarios hablados fuera de campo en reportajes o documentales;
- verde: para indicar el empleo de un idioma extranjero.
Como ve la retranscripción le permite subtitular su archivo de vídeo gracias a los formatos .srt y .webvtt.
3) Formatos de archivos con timecode
Ejemplo de archivo con timecode exportado con Authôt.
Disponible para exportar una transcripción automática.
Disponible para exportar una transcripción automática.
Es posible exportar su retranscripción en formato .text, lo que le permite leer los timecodes de sus archivos.
Los archivos con timecode son altamente usados por las productoras audiovisuales que hacen muchos montajes de vídeos. La retranscripción automática y la exportación en .text les hace ganar un tiempo considerable. Estas trabajan además con guiones técnicos con su pietaje para la edición.
4) Formatos de archivos .html
Ejemplo de archivo .html exportado con Authôt.
Disponible para exportar una transcripción automática.
Disponible para exportar una transcripción automática.
El formato .html es el formato de data concebido para los sitios web. Es un lenguaje de marca de hipertexto. Está disponible en la aplicación web Authôt y permite agregar la lectura digital sincronizada para sus audios o vídeos.
5) Formatos de archivo .xml
Este formato es un lenguaje genérico extensible, llamado Lenguaje Extensible de Marcas en español. Está concebido para almacenar información de cualquier naturaleza en archivos estructurados en forma de árbol, mediante el uso de etiquetas y según ciertas reglas propias de este formato.
Se llama extensible porque la gramática y el lenguaje XML no son fijos, sino que se definen en cada documento mediante una referencia a este esquema. Algunos lenguajes son XHTML, XSLT, RSS y SVG.
A diferencia del lenguaje html, el xml es menos rígido, dado que permite crear y personalizar etiquetas. Hace más fácil la organización y formateo de sus datos.
Por ejemplo con Authôt, la organización de sus datos se puede hacer por medio de etiquetas “palabras”, que contienen un atributo “start” y un atributo “end". Gracias al XML, puede también crear una estructura personalizada, crear subtítulos, etc.
6) Formatos de archivo .sjson
Ejemplo de archivo .sjson exportado con Authôt.
Disponible para exportar una transcripción automática.
Disponible para exportar una transcripción automática.
Es un formato de intercambio de datos abierto y basado en texto. Es más fácil de interpretar que el XML y está basado en texto estándar para representar datos estructurados en la sintaxis de objetos de JavaScript.
Se muestra organizado como en un cuadro dividido en tres partes: los “starts”, los “ends” y el “text”. A diferencia del formato html, por ejemplo, en el que los “starts” y “ends” están en el texto para permitir la sincronización.
El formato .sjson responde a demandas muy específicas y está disponible en nuestra aplicación.
Captura de pantalla de la aplicación Authôt con la lista de archivos
disponibles para exportar una transcripción automática.
disponibles para exportar una transcripción automática.
Authôt es una start-up francesa especializada en la retranscripción automática. Ofrece una aplicación web para transformar los archivos de audio o vídeo en texto.
Uno de sus atributos es la gran variedad de formatos de archivo que ofrece al momento de exportar su audio o vídeo ya transcrito, permitiendo responder a las necesidades de todo aquel que utilice la aplicación.
¿Necesita exportar su archivo en otro formato a los disponibles en nuestra aplicación? No dude en contactarnos 🙂