Emu Video de Meta promete hacer realidad la creación de películas por medio de la IA Emu Video de Meta promete hacer realidad la creación de películas por medio de la IA.
La huelga de los actores y las actrices ha terminado en Hollywood, pero eso no significa que el evolución de la inteligencia artificial (IA) para poder crear películas se detenga.
Pese a los acuerdos entre el sindicato de actores (SAG-AFTRA) y la Alianza de Productores de Cine y Televisión (Alliance of Motion Picture and Television Producers), que incluye cláusulas que protegen a los miembros del sindicato de la amenaza que la IA representa, los laboratorios y empresas dedicadas al desarrollo de la IA generativa siguen avanzando, y lo hacen a pasos agigantados.
Prueba de ello son Emu Video y Emu Edit, dos desarrollos mostrados por Meta esta semana.
En una página oficial de Meta dedicada a la IA, se explica: "Con Emu Video, que aprovecha nuestro modelo Emu, presentamos un método sencillo para la generación de texto a video basado en modelos de difusión. Esta es una arquitectura unificada para tareas de generación de video que puede responder a una variedad de entradas: solo texto, solo imagen y tanto texto como imagen. Hemos dividido el proceso en dos pasos: primero, generar imágenes condicionadas a un texto de inicio y luego generar video condicionado tanto al texto como a la imagen generada".
Meta ha bautizado al proceso como "generación de video factorizado" y se asemeja al principio de la animación cuadro por cuadro. La IA genera una serie de imágenes que son "mostradas" en secuencia para dar la sensación de movimiento.
Los resultados ya son sorprendentes.
La empresa explica que, a diferencia de modelos anteriores que eran sumamente complejos, Emu solo utiliza dos modelos de difusión y por ahora puede generar videos de cuatro segundos en una medida de 512 x 512 pixeles que corren a 16 cuadros por segundo.
Aunque la calidad todavía no es la óptima (el cine análogo corre a 24 cuadros por segundos), los avances son indiscutibles.
Emu Video permite a los usuarios animar una imagen acompañándola de una instrucción de texto para explicarle a la IA qué es lo que debe de hacer. Por su parte Emu Edit permite al usuario dar instrucciones posteriores a la creación de su video para refinarlo y llegar al resultado deseado (si has utilizado sistemas de IA generativa, ya sabes que esto no es tan fácil de lograr).
Relacionado: ¿Qué papel jugará la IA en los guiones de Hollywood? Esto es todo lo que se acordó después de la huelga