Google desarrolla un sistema de inteligencia artificial capaz de completar audios de voz y música La herramienta lleva el nombre de AudioLM y podría ser utilizada para la generación de pistas automatizadas para acompañar clips de video en redes sociales.
Por Entrepreneur en Español Editado por Eduardo Scheffler Zawadzki
Poco a poco la inteligencia artificial se ha ido inmiscuyendo en todos los ámbitos de nuestra vida. De herramientas digitales que crean imágenes o videos a partir de texto, pasando por asistentes virtuales y algoritmos que dan recomendaciones personalizadas a los usuarios según sus hábitos, gustos y costumbres.
Ahora Google ha desarrollado un sistema de inteligencia artificial capaz de completar un clip de audio a partir de una muestra de unos cuantos segundos. Lleva el nombre de AudioLM y puede trabajar tanto con voces humanas que imita a la perfección, como con música.
En el caso de los fragmentos de voz, el sistema analiza las palabras de referencia para crear frases con coherencia y significado (una especie de DALL-E, pero de enunciados) y el resultado es tan bueno que resulta prácticamente imposible distinguir las palabras generadas por la inteligencia artificial de aquellas pronunciadas por una persona real.
Pero AudioLM no solo trabaja con palabras y voz. El sistema es capaz de continuar una pieza musical compleja a partir deli mismo principio: una referencia auditiva de unos cuántos segundos sirve para crear una composición entera.
El sistema también es capaz de reemplazar la voz grabada en un audio por una distinta que se siente totalmente real.
En la página oficial del proyecto (en la que puedes escuchar varias muestras) se explica: "Mediante la capacitación en grandes corpus de formas de onda de audio en bruto, AudioLM aprende a generar continuaciones naturales y coherentes a partir de indicaciones cortas. Cuando se entrena en el habla, y sin ninguna transcripción o anotación, AudioLM genera continuaciones de habla sintáctica y semánticamente plausibles, mientras mantiene la identidad del hablante y la prosodia para los hablantes invisibles".
Los usos de AudioLM
Aunque el sistema aún se encuentra en desarrollo es una muestra más de los usos que puede tener la inteligencia artificial en la actividad creativa. Según los expertos con una herramienta como AudioLM, pronto podríamos contar con música autogenerada que suene realista y armónica para acompañar los clips de nuestros videos en redes sociales. Además, los avances en la generación/imitación de voz representan grandes noticias para las herramientas de accesibilidad a la red para personas con alguna discapacidad.
Como suele suceder con este tipo de desarrollos y herramientas, AudioLM abre una serie de preguntas éticas que habrá que responder poco a poco. Una de ellas es: ¿el músico que compuso los segundos que sirven como referencia recibirá algún tipo de crédito en la obra final?