miércoles, 13 de agosto de 2014

Texto a Voz + SRT

Text to Speech + Subrip Subtitle

Algunas veces me gusta leer y al mismo tiempo escuchar lo que leo. Esto me permite llevar un ritmo constante y lograr mayor concentración en la lectura.

El otro día quise subir un texto a Youtube, sintetizado con una voz Loquendo y con subtítulos, de modo que desde Youtube el lector pudiera escuchar y al mismo tiempo leer la transcripción. Procedí a sintetizar el texto a voz utilizando SodelsCot Estándar y la voz de Loquendo Ximena. SodelsCot convierte a un archivo de audio el texto copiado al portapapeles y Youtube tiene una función que permite cargar la transcripción en formato de texto y convertirla a subtítulos en el video. Pero tanto SodelsCot como Youtube han presentado algunos inconvenientes:

  • Si el texto es muy grande, SodelsCot falla en el proceso de conversión de Texto a Voz.
  • Durante la conversión, prácticamente no se puede usar el portapapeles para otra cosa, ya que interfiere con el archivo de audio generado o crea archivos de más.
  • SodelsCot solamente permite convertir un texto a audio a la vez.
  • Si el texto es relativamente grande, Youtube demora muchas horas en procesar la transcripción.
  • Youtube falla frecuentemente, mostrando un mensaje de error en el procesamiento de la transcripción.
Con tanta "fricción cognitiva", pensé que sería mejor escribir un pequeño programa de uso personal que permita realizar lo siguiente:
  1. Recibir como entrada un archivo de texto plano.
  2. Generar 2 archivos, uno de audio (mp3 o wav) y un SRT con los subtítulos correspondientes.

SubTTS

SubTTS es el nombre con el que bauticé al programa. Por ahora es una aplicación de consola parametrizable por medio de un archivo de configuración.

SubTTS fue escrito en C# sobre .Net Framework 4.


Utilizando SubTTS

  1. Lo primero es descargar el programa aquí. Para descomprimir el RAR utiliza WinRAR y la clave: cristiandlr.blogspot.com
  2. Una vez descomprimido, ejecutar TTSub.exe para comprobar el listado de voces instaladas. Presionar Ctrl + C para salir del programa.
  3. Editar el archivo de configuración TTSub.exe.config y establecer los siguientes parámetros:
    • PathToText. Ruta completa al archivo de texto que se procesará.
    • WordsPerSub. Número de palabras por cada subtítulo.
    • VoiceName. Una de las voces instaladas (listadas en el paso 2).
    • VoiceRate. Velocidad de lectura, los valores oscilan entre -10 y 10.
    • OutputFormat. WAV o MP3.
  4. Una vez guardada la configuración, ejecutar nuevamente TTSub.exe, pero esta vez presionamos Enter para continuar luego de ver las voces instaladas.
  5. La ventana se cerrará sola al finalizar el trabajo y los archivos resultantes (wav y srt) quedan en la misma carpeta donde está el archivo de texto.

Qué hacer con los archivos?

Por ahora SubTTS es una herramienta que cumple una tarea muy simple. Por sí mismos los archivos de audio (wav o mp3) y srt (subrip subtitle) no pueden utilizarse juntos en un reproductor de audio convencional. El archivo de audio debe ser codificado en un formato de video (mp4, wmv, etc.) para que el reproductor cargue y despliegue los subtítulos. Se puede utilizar una herramienta como Windows Movie Maker para crear un video.

Licenciamiento

El programa es de uso libre para cualquier fin.

2016 11 25 Actualización: He publicado el código fuente en github.