¿Ha lanzado Microsoft un creador de "deepfakes"? En su evento anual la empresa presentó Azure AI Speech to Text, un desarrollo para crear y dotar con voz a avatares fotorrealistas.
Por Eduardo Scheffler Zawadzki Editado por Eduardo Scheffler Zawadzki
En solo un año la inteligencia artificial (IA) pasó de ser un concepto utilizado en las novelas y películas de ciencia ficción, a un indiscutible protagonista de nuestro día a día. Aunque se trata de una tecnología que existe desde hace al menos 68 años (el término fue utilizado por vez primera en 1955 por John McCarthy, Marvin Minsky y Nathaniel Rochester), fue con la llegada de ChatGPT, de OpenAI, que su uso se democratizó.
De pronto tuvimos al alcance de nuestras manos una herramienta capaz de ayudarnos a resolver problemas para volvernos mucho más productivos. Emocionados, empezamos a comprobar por nosotros mismos la capacidad de la disruptiva tecnología. Pero con su popularización surgieron también los miedos y las voces que comenzaron a advertir sobre las implicaciones y peligros de la inteligencia artificial.
Hubo quien habló de los riesgos de perder nuestros empleos ante ella y de modo en el que podía ser utilizada para generar deepfakes, esos contenidos creados a partir de personas reales para engañar a la audiencia.
Aunque hoy sabemos que, más que quedarse con nuestros empleos, la IA puede ayudar a potenciar nuestra capacidad, el temor de que se use para generar contenido falso sigue siendo una realidad.
Quizás por ello ha sorprendido tanto el lanzamiento de la nueva herramienta de Microsoft.
Relacionado: Narrador de los audiolibros de Harry Potter acusa a la IA de clonar su voz
¿Qué es Azure AI Speech to Text de Microsoft?
Azure AI Speech to Text es una herramienta capaz de crear avatares fotorrealistas animados de una persona real basados en un video o fotografía. El desarrollo permite al usuario alimentar con instrucciones al avatar que hable y diga cosas basadas en una entrada de texto. Es decir: Azure AI Speech to Text pareciera, de un primer vistazo, ser un generador de deepfakes.
La plataforma fue presentada durante Ignite, la conferencia anual en la que Microsoft muestra todas sus novedades.
En una entrada en su blog oficial, Microsoft explica: "Con un avatar de texto a voz, los usuarios pueden crear videos de manera más eficiente... para construir videos de entrenamiento, introducciones de productos, testimonios de clientes [y más] simplemente con entrada de texto. Puedes utilizar el avatar para construir agentes conversacionales, asistentes virtuales, chatbots y más".
Aunque por ahora el uso de esta herramienta es limitado y solo está disponible para algunos usuarios de Azure (la plataforma en nube de Microsoft), la liberación de la herramienta ha generado cierta preocupación, pues el modo de operar de Azure AI Speech to Text es similar al de herramientas como Synthesia que ha sido utilizado para generar noticias falsas en China y en Venezuela.
El uso no ético de la IA para generar deepfakes ha generado controversia y la necesidad de regularla ha estado en la agenda política de diversos países y fue tema central de la huelga de los actores en Hollywood quienes estaban preocupados de que los estudios comenzaran a utilizar la IA en lugar de actores y actrices para sus producciones.
Relacionado: ¿Van los deepfakes en aumento? ¿Cambiarán la forma en que las empresas verifican a sus usuarios?