Meta crea una herramienta de inteligencia capaz de crear videos a partir de texto Según Mark Zuckerberg Make-A-Video es capaz de hacer lo mismo que DALL-E, ¡pero en video!
Por Eduardo Scheffler Zawadzki Editado por Eduardo Scheffler Zawadzki
Desde que fue liberado DALL-E, esa herramienta de inteligencia artificial capaz de transformar palabras y frases en imágenes, no ha dejado de cautivarnos. La plataforma creada por OpenAI ha interpretado las más diversas frases de los usuarios dejando clara la capacidad creativa que una máquina puede poseer.
Hasta el momento DALL-E y competidores como Midjourney o IMAGEN se han limitado a crear imágenes estáticas, pero ahora Meta ha dado un paso al frente y creado una herramienta que funciona con el mismo principio, pero entrega resultados en pequeños videos en formato de gif animado.
La herramienta lleva el nombre de Make-A-Video y en un post subido a su cuenta de Facebook, Mark Zuckerberg explicó: "El progreso es bastante sorprendente. Es mucho más difícil crear videos que fotos porque, más allá de generar correctamente cada píxel, el sistema también tiene que predecir cómo cambiarán con el tiempo. Make-A-Video resuelve esto al agregar una capa de aprendizaje no supervisado que permite al sistema comprender el movimiento en el mundo físico y aplicarlo a la generación tradicional de texto a imagen".
El fundador y CEO de Meta compartió un clip en el que se pueden ver algunos de los mini videos que la herramienta ha generado: un oso de peluche pintando un autorretrato, una nave espacial aterrizando sobre la superficie de Marte, un perezoso con un gorro de lana tratando de entender cómo funciona una computadora y un robot surfeando una ola en el océano.
¿Cómo funciona Make-A-Video?
Los ingenieros de Meta hicieron público un texto en el que explican el funcionamiento de la herramienta y lo que la hace diferente de otras plataformas. A diferencia de otros modelos de lenguaje de inteligencia artificial, el método de texto a video (T2V) de Meta no utiliza pares de texto y video predefinidos. Esto quiere decir que no empareja la búsqueda "niño nadando" con un video de un niño nadando, sino que crea uno nuevo a partir de los millones de datos de un "niño nadando" que existen en su base de datos.
El potencial creativo y laboral que tienen este tipo de herramientas hace que estén cada vez más presentes en nuestra vida diaria. Hace unas semanas un hombre reportó haber ganado un concurso de pintura con una obra generada a partir de Midjourney, una herramienta muy similar a DALLE-2.
Según el post de Mark Zuckerberg Make-A-Video no está todavía disponible para el público en general, aunque planea liberar el demo para que lo prueben los usuarios en el futuro cercano.