Hola:

En http://www.laopinion.com/ aparece el nuevo programa.

Poner las palabras en la boca

Ha salido a la luz la invención de un programa de computadora que reacciona a los sonidos de la lengua creando las correspondientes imágenes animadas de la boca y zonas aledañas. Esta nueva técnica podrá poner las palabras que uno quiera en la boca de a quien más a uno le convenga sin que se pueda saber con certeza si hay manipulación. La invención tiene consecuencias importantes de índole ética y social. ¿Se podrá en el futuro confiar en lo que nos digan los medios audiovisuales? ¿Habrá que volver al más antiguo de los sistemas de comunicación: ver y escuchar en vivo para creer? ¿Cómo va a defenderse la sociedad de este fraude de falsificación o usurpación de las palabras? Vale la pena reflexionar sobre ello.

Un equipo de científicos del Instituto Tecnológico de Massachusetts (MIT) ha creado los primeros videos con imágenes realistas en los que a los hablantes se les ponen las palabras en la boca. En la demostración, se grabó a una mujer hablando frente a una cámara para pasar a continuación a reprocesar los materiales y desarrollar un nuevo video en el que la mujer dice otras frases. Se experimentó, también, poner en boca de la mujer una canción en japonés, lengua que no hablaba.

Los usos del invento son variados en el mundo inevitable al que (algunos dicen que) nos dirigimos. Se habla de aplicarlo a videojuegos y a crear efectos especiales para películas. Con el desarrollo de la nueva técnica se podría devolver a la pantalla a Marilyn Monroe o a cualquier estrella desaparecida y ponerle nuevas frases a nuestra conveniencia.

No obstante, la aplicación más evidente sería la que correspondería a la rentable industria del doblaje. Se acabarían los doblajes molestos en los que la voz y la imagen van cada una por su lado, no ya sin sincronización sino en imposible concordancia por las diferencias en sonido y esfuerzo articulatorio que cada lengua personaliza. Lo que no se escapa es que se está creando una nueva forma de engaño social en la que la propaganda fraudulenta estaría a la orden del día. El daño a la credibilidad de los materiales audiovisuales parece irremediable.

Uno de los conejillos de indias y víctima de los investigadores es Ted Koppel, el presentador de Nightline en ABC. Se pretende que dirija un programa en español, lengua que no habla, y que suene auténtico. En el futuro, el presidente del país podría dirigirse en forma realista --que ahora pasaría a ser "pseudorrealista", más que "virtual"-- a las diferentes comunidades multilingües del país en sus propias lenguas. Se podría crear la pseudovivencia de un contacto imposible en cualquier lengua deseada. A pesar del aparente beneficio comunicativo, habrá quien prefiera escuchar al presidente en su tosco chapurreo español que en "correcto" español. Sería el comienzo de una carrera por imponer unas variantes de español sobre otras. Conseguir escuchar al presidente en una variedad específica significaría la implantación de un patrón modelo. ¿Qué español se seleccionaría para el presidente, el de Cuba, el de Puerto Rico, el de México, el de España, cuál? Otra posibilidad sería seleccionar uno diferente para cada ocasión, "a la carta". A la larga, sólo conduciría a una despersonalización lingüística del español del presidente. No se ve un gran avance; se despertaría únicamente el enfrentamiento entre los hablantes de diferentes dialectos por promocionar el suyo como superior.

Un problema mayor, aún no resuelto, es la dificultad de dar emoción a las palabras. Al igual que en previos intentos por crear un simulador de movimientos faciales adaptable al sonido, sólo se percibe naturalidad en la producción de frases breves. Un fragmento extenso deja al descubierto la falta de vida del modelo. Lo verdaderamente preocupante es que para resolver el problema se pretenda crear un modelo más complejo que enseñe a la computadora a reflejar emociones. Al llegar a este punto se podría alcanzar la indeseable meta de tener lengua y emoción a la carta. Ya no tendría el político que hacer un gran esfuerzo para comunicar su mensaje; se fabricaría al gusto del que pudiera permitirse el lujo de costearse la compra o los servicios del programa. Es, asimismo, el final de la carrera de los grandes actores; los mediocres podrán representar lo mejor de lo que se pueda programar, que será bastante. Es muy posible, sin embargo, que si se llega a este extremo de falta de autenticidad se produzca una reacción general de rechazo y todo se vuelva sospechoso.

Menos mal que el sistema tiene limitaciones. El programa sólo funciona cuando el hablante está frente a la cámara y sin moverse mucho, al modo de un presentador de noticias o del presidente en sus mensajes desde la Casa Blanca. Otro problema: el programa produce únicamente video: no puede añadir nuevo sonido a imágenes. La solución a estos problemas no parece, sin embargo, muy complicada como indica Tomaso Poggio, miembro del equipo investigador.

Es importante aclarar que no es la primera vez que se intenta desarrollar esta tecnología. Durante años los técnicos de animación han intentado usar las computadoras para poner palabras en boca ajena.

Quizás alguien recuerde el niño de Baby Bob. Ahora, a diferencia de intentos anteriores, no hace falta trabajar manualmente en la computadora, el programa está casi enteramente automatizado. Los intentos anteriores se basaban en crear un modelo virtual de la boca del personaje para después crear imágenes digitales adaptadas al movimiento. El nuevo modelo consiste en enseñar a una máquina cómo se comporta una persona cuando habla. Lo único que se necesita es hablar unos minutos frente a la cámara y grabarlo. La computadora capta en imágenes la gama de los movimientos faciales que se corresponden con los sonidos y queda capacitada para reproducirlos aun perteneciendo a palabras diferentes.

Aunque todos siempre podemos sospechar de algún trucaje, este modelo hace que no se pueda discernir bien entre lo que está manipulado y lo auténtico. Si esa es la meta, el engaño está servido. Finalmente, decir que todo esto conducirá a una revaloración del testimonio en vivo: una recuperación de nuestro pasado más lejano.

Saludos