Los videos conocidos como deepfake no paran de sorprendernos... y por qué no, atemorizarnos un poquito. El software (que, esencialmente, reemplaza un rostro por otro) puede ser utilizado con fines de entretenimiento (como cuando Bill Hader imitó a Arnold Schwarzenegger en el programa de Conan O'Brien) o con fines algo más oscuros, como la difusión de las bautizadas fake news.
En este terreno, la cuenta de YouTube Ctrl Shift Face hace ya un tiempo que viene dando que hablar. Esta semana lo hizo con un video donde el rostro de Jim Carrey es insertado sobre el de Jack Nicholson en su icónica interpretación como Jack Torrance en The Shining, el clásico de 1980 dirigido por Stanley Kubrick. Convengamos que, si hay alguien que podría imitar a la perfección la plasticidad facial de Nicholson, es Jim Carrey. Pero esto va mucho más allá.
Tienen que verlo ustedes mismos:
Ante la enorme repercusión que tuvo el clip, le siguieron dos más:
Sinceramente la implementación del DeepFake es casi imperceptible. Si le mostramos estos clips a alguien que jamás vio el film de Kubrick, o no conociera bien la voz de Nicholson, le resultaría muy muy difícil notar la manipulación digital (especialmente en el segundo video), y sin dudarlo pensaría que Carrey es el protagonista original del film.
Pero... ¿cómo funciona exactamente todo esto? El sitio Filo.news lo explica mejor que nosotros:
El DeepFake es un software creado por desarrolladores muy importantes de las mejores universidades, que básicamente usa inteligencia artificial con aprendizaje automático que permite agregar, borrar, o cambiar lo que hace una persona en un video. En ese caso, 'switchea' caras. También se aplica a la transformación de discurso y también a la modificación de gestos en una persona.
En este caso puntual:
Primero, se escaneó el clip original para obtener los sonidos que más se repiten de Jack Torrance para encontrar un patrón. Después, se escanean estas sílabas con su correspondiente forma de decirlos en voz alta; por ejemplo, hay letras que salen de los labios de una manera muy similar con otras. Así, vas cubriendo todas las palabras. Teniendo las expresiones faciales correspondientes a cada sonido en ambas personas, el software crea un modelo 3D basado en un archivo con la cara del tercero en cuestión, previamente analizado. La frente se mantiene, y de las cejas para abajo se modifica. Se combina toda la data recolectada y por último se 'pega' el material nuevo con el viejo y voilá.
Ah. Sencillito. |
¿Dónde terminará esta tecnología? ¿Es otro paso hacia el dominio absoluto de Skynet? ¿Black Mirror usará esto como tema central para su próxima temporada pedorra?
Para no conocer la respuesta a estas preguntas pero sí ver los mejores videos que andan dando vueltas en la web, sigan en La Cuarta Pared.
0 comentarios:
Publicar un comentario