Generalitat de Catalunya
Español  Català  English 
archivos
Grabar nuestra voz ahora para usarla en el futuro

Enviado por FLASHTICSALUT 01/10/2009
El uso y desarrollo de las nuevas tecnologías ayuda a hacer frente a las consecuencias de distintas enfermedades, como por ejemplo la pérdida progresiva del habla. Con anterioridad a que desaparezca la capacidad de modular sonidos de forma inteligible es posible registrar nuestra voz para utilizarla en el futuro.

Este artículo realiza una descripción global del estado del arte en relación a la síntesis de voz e incorpora las principales referencias disponibles en el sector. Ofrece además una serie de recomendaciones para optimizar el registro de un banco de voces destinadas a todo aquel que bien por necesidad, bien por interés, necesite o quiera profundizar en dicho ámbito de conocimiento.

Fuente: ACNR_Advances in Clinical Neuroscience & Rehabilitation



El uso y desarrollo de las nuevas tecnologías ayuda a hacer frente a las consecuencias de distintas enfermedades, como por ejemplo la pérdida progresiva del habla. Con anterioridad a que desaparezca la capacidad de modular sonidos de forma inteligible es posible registrar nuestra voz para utilizarla en el futuro. De las distintas tipologías de síntesis de voz, la más básica consiste en reproducir frases registradas con anterioridad. Sin embargo, esta aproximación limita la información reproducible a la capacidad de almacenamiento y a lo previamente registrado.

Una segunda opción, más versátil, es el denominado enfoque concatenativo. Como su nombre indica, consiste en unir o enlazar unos sonidos con otros para producir cualquier palabra deseada en el idioma en el que se haya realizado la grabación inicial. Comparada con el registro por frases, esta modalidad reproduce un habla más natural e inteligible. Entre los productos que usan la tecnología podemos destacar ModelTalker. Se trata de un software gratuito de síntesis de voz diseñado para beneficiar a todas aquellas personas que estén perdiendo o hayan perdido ya su capacidad para hablar. De este modo, pueden hablar bien mediante una versión sintética de su propia voz, bien a través de la voz sintética disponible en el banco de voces que mejor les represente. La voz sintética generada es virtualmente ilimitada, puede generar cualquier expresión, incluyendo palabras o frases que no hayan sido previamente grabadas.  

La tercera aproximación a la síntesis vocal, se basa en los denominados modelos de Markov. Destaca por ofrecer una entonación más robótica pero globalmente genera expresiones más consistentes que el método concatenativo. Del mismo modo los parámetros que constituyen la voz resultante son mucho más fáciles de manipular, y en consecuencia, puede ajustarse más fácilmente a la voz y necesidades del usuario. Otra ventaja de esta técnica es que la cantidad de datos de voz necesarios para producir un resultado de calidad son considerablemente inferiores al resto. Con apenas 7 minutos de discurso continuado, unas cien expresiones, es suficiente.

Una línea de investigación que promete resultados esperanzadores la desarrolla actualmente el CAST (Clinical Applications of Speech Technology) de la Universidad de Sheffield. Este grupo de trabajo investiga como almacenar y reproducir posteriormente voces cuando el proceso de deterioro de la voz de la persona ya ha empezado. El algoritmo, entonces, debe mantener los elementos que caracterizan e identifican la voz del hablante mientras que los rasgos que han quedado más afectados por la enfermedad se sustituyen por otros de calidad suficiente. Como puede entreverse, las aplicaciones son múltiples y constituyen una ventana de esperanza que se abre a todas las personas afectadas por aquellas enfermedades que producen la pérdida de la capacidad de hablar.



Referencia bibliográfica

S. Creer, P. Green, S. Cunningham (Mayo-Junio 2009) Voice Banking. ACNR_Advances in Clinical Neuroscience & Rehabilitation, Volumen 9, Número 2. [acceso 24 de agosto de 2009]. Disponible en: http://www.acnr.co.uk/may_june_09/ACNRMJ09_rehab_voice.pdf

Acceso al documento original Inglés 
© 2008 TicSalut. Departamento de Salud. soporte@flashticsalut.es | Información editorial | Aviso legal | Mapa web
Diseño web: Espaivirtual
Creative Commons License
Esta obra de TicSalut - Departamento de Salud está bajo una licencia de Creative Commons.