Check the new version here

Popular channels

De texto a mp3: evaluación de programas

De texto a mp3: evaluación de programas

Pasar un archivo de texto (o un .doc, .pdf, .rtf...) a un .mp3 significa poder llevarte el texto en un reproductor de mp3 y escucharlo mientras caminás, viajas, etc. A mi, que por mi laburo tengo que pasar muchas horas sobre un móvil, me resulta bastante.
Además, es evidente la ventaja que esto representa para las personas con discapacidades visuales: desde la lectura de lo que sucede en pantalla hasta la posibilidad de escuchar libros.

Hay muchísimos productos que realizan este proceso de conversión pero hay que tener en cuetna lo siguiente:

Se necesitan estos elementos:

a) voces sintéticas: Son archivos donde están grabadas las voces humanas que servirán para la conversión. Dicho de un modo supersimplificado, sería como un "diccionario" donde a cada letra le corresponde un sonido: a la letra "a" le corresponde el sonido "a", etc.
Estas voces sintéticas son utilizadas por distintos programas: lectores de pantalla, lectores de archivos, conversores de archivos, etc.

Las hay de distintas calidades, desde las que tienen una voz superobotica (tipo el XL5, para los que tienen más de 40), hasta voces supernaturales, que realmente uno duda de que eso sea producido computarizadamente.

Entre las más conocidas están:

http://activex.microsoft.com/activex/controls/agent2/lhttsspe.exe
http://download.microsoft.com/download/1/2/2/12246417-CD66-4541-B32B-8CD18E92AAE7/RSSolo4Spanish.zip

Estas voces son de microsoft y supuestamente "free", aunque leyendo la licencia no podría asegurar que sea asi.

Además están las voces de

AT&T
http://www.naturalvoices.att.com/

NeoSpeech
http://www.neospeech.com/

que no conozco

De las que he escuchado las más naturales, que realmente impresionan son las de la empresa loquendo:

http://www.loquendo.com/es/
y en esta direccion tienen una demostración interactiva de la voz:

http://actor.loquendo.com/actordemo/default.asp?language=es

Son voces que no son gratuitas, hay que pagar, aunque la gente mala, las consigue por ahi...

Luego necesitamos el conversor a .mp3

He probado el TextAloud (shareware) que ví que alguien lo puso en Taringa. A mi no me funcionó muy bien, se colgaba, etc.

Yo uso un programa free que se llama Balabolka

http://www.cross-plus-a.com/balabolka.htm

que funciona con cualquiera de las voces arriba mencionadas.

Un problema que van a tener si convierten un texto largo es que los reproductores de mp3 no permiten -al menos los que yo conozco- moverse para atrás o adelante dentro de un mismo mp3.

Esto significa que si yo tengo un archivo mp3 de media hora y, por alguna razón, cambio de tema, por ejemplo porque me aburrí y puse una canción de Sabina, cuando quiera volver al texto, tengo que empezar desde el principio. La solución a esto es partir el archivo en pequeños archivos de una página, que se traducirán en mp3 de 5 minutos. En este caso, ya no tendremos tanto problema, porque o terminamos de escuchar los 5 minutos, o, cuando retomemos el texto, lo escuchamos de nuevo. Algunos programas como TExtAloud, creo que permiten ir cortando el archivo. Si no, bueno, deberemos solucionarlo a mano, en el texto o en el mp3.

Otro tema a tener en cuenta es que hay que acostumbrarse a escuchar. A mi al principio me pasaba que me distraía y tenía que volver a escuchar todo, pero con el tiempo el cerebro se acostumbra y mejora la concentración.

Texto a sonido en Linux

Para los que tienen Linux, yo recomiendo el programa
Festival

http://festvox.org/
que trae una voz en español, como parte del proyecto.

A la vez, se pueden instalar dos voces creadas por la Junta de Andalucía

http://forja.guadalinex.org/repositorio/frs/?group_id=21

que están bastante buenas, aunque no llegan a la calidad de las loquendo de windows.

Hay también otro proyecto, MBROLA

http://tcts.fpms.ac.be/synthesis/mbrola.html

pero la verdad es que no pude instalarlas con Festival.

Existe también IRCHA, pero no lo probé

En fin, es todo.

Si les interesa el tema acá tiene dos entradas a la wikipedia que explican un poco más la teoría de las voces sintéticas. Si hay interés puedo hacer un segundo post explicando a fondo la instalación de festival en linux.

Pablo
0No comments yet
      GIF
      New