hi

Clonan tu voz con solo escucharla seis segundos

Los locutores pueden temblar, pues si no se preparan, si no dejan de ser lectores de noticias o mensajes de redes sociales, serán sustituidos por máquinas.

Los políticos deben cuidarse, pues algoritmos pueden poner en su boca cosas que nunca han dicho.

Las fake news están a punto de generar caos, si toda la inteligencia artificial que presumen los expertos en tecnología hoy, se pone en manos de cualquiera con acceso a internet.

“También necesitamos una pequeña serpiente plástica falsa”, la mujer dice con un acento inglés del norte, “y una gran rana de juguete para los niños”.

La oración es un poco tonta, quizás, perfectamente inocua.

Aún así, esos seis segundos de habla natural es todo lo que se necesita para que un nuevo algoritmo chino clone su voz y la haga decir lo que sea que el usuario desee.

El programa Deep Voice, que fue construido por Baidu, un gigante de la tecnología algunas veces descrito como la contraparte asiática de Google, usa una técnica de inteligencia artificial (IA) para copiar las voces estadounidenses y británicas de tan solo un puñado de breves clips de audio.

El desarrollo levanta preocupación sobre una nueva especie insidiosa de noticias falsas en el que manipular las voces de los políticos o celebridades será un juego de niños para cualquiera con el software indicado en su computadora.

The Times publicó una reconstrucción minuciosa del discurso que el presidente de los Estados Unidos John F. Kennedy estaba preparando para dar en Dallas Trade Mart antes de su asesinato hace 55 años. La resurrección de a voz de Kennedy en detalle preciso, con su deslizamiento de vocales y cadencias de Boston, tomó a ingenieros de sonidos de la empresa de tecnología del haba escocesa CereProc ocho semanas y 831 grabaciones.

Sin embargo, los recientes avances en IA significan que en unos años solo deberá tomar algunas horas producir una imitación convincente de  Theresa May o Boris Johnson, de acuerdo a Matthew Aylett, co-fundador de CereProc.

El alcance de las travesuras es considerable. El Dr. Aylett, ex investigador en la Universidad de Edinburgh, dijo que durante la elección presidencial de Estados Unidos del 2012 su compañía había rechazado la oferta de una compañía de la costa oeste de comprar su voz sintetizada de Barack Obama.

Por ahora, el mercado de la clonación de voz está hecho principalmente de gente que teme perder el poder del habla debido a enfermedades crónicas, como esclerosis lateral amiotrófica, que afligió al fallecido Stephen Hawking. CereProc ha reconstruido las voces del crítico de cine Roger Ebert y la del jugador de futbol americano de Nueva Orleans Steve Gleason, además de editar un compendio de los discursos de la Reina para que parezca como si hubiera compuesto un rap.

La compañía por lo regular pide a sus clientes que se graben leyendo más de 600 oraciones, equivalentes a al menos 40 minutos de habla. Adobe, la compañía detrás de Photoshop, clama haber hecho una contraparte de clonación de voz a su software de edición de imágenes que requiere de sólo 20 minutos de audio.

Si las afirmaciones de Baidu, que fueron publicadas en un documento en el sitio web de pre-publicación arXiv.org, son reales, puede hacer el mismo truco con un puñado de muestras.

En lugar de construir la voz clonada desde cero, Deep Voice toma un modelo de una librería hecha de otras dos mil 400 voces de personas y después la retoca hasta que la voz suena a la del hablante.

“El trabajo de Baidu es realmente interesante”, dijo Aylett. “Son un equipo muy creíble de investigación. Sus muestras suenan muy bien. La pregunta es si ellos escogieron cuidadosamente algunas de las muestras para hacerlo sonar mejor”.

Los estadounidenses encontraron el sonido del presidente Kennedy dirigiéndose a ellos como si viniera del más allá de la tumba perturbador y emocional.

 

 

NO ES CIENCIA FICCIÓN, SI QUIERES VER EL AVANCE DE ESTA TECNOLOGÍA CONSULTA A BAIDU.

 

 

 

 

 

 

 

 

 

 

 

-->