Ending Soon! Save 33% on All Access

Conoce a VALL-E, la aplicación de inteligencia artificial de Microsoft capaz de imitar cualquier voz a la perfección La empresa planea integrar soluciones de inteligencia artificial a sus principales productos; este modelo de texto a voz es una de ellas.

NurPhoto | Getty Images

El nombre del juego para este 2023 en Microsoft es inteligencia artificial (IA).

Tras haberse asociado con OpenAI en 2019, y haber inyectado $1,000 millones de dólares a la organización, Microsoft comienza a integrar diversas soluciones de IA a sus productos.

En octubre del año pasado la empresa incorporó la herramienta de creación de imágenes DALL-E 2 a su app Designer y hace unos días anunció la próxima integración del modelo de lenguaje de inteligencia ChatGPT-3 artificial a su buscador, Bing, para desafiar a Google y cambiar para siempre el modo en que funcionan los buscadores.

Ahora Microsoft ha anunciado una nueva aplicación llamada VALL-E (sí, nosotros tampoco pudimos evitar pensar en Wall-E) capaz de imitar cualquier voz a partir de tan solo tres segundos de grabación.

El modelo de voz no solo es capaz de imitar el timbre y entonación del material original, sino que puede captar las emociones contenidas en el audio para después replicarlas. Lo mismo sucede con la ambientación de la pieza original.

Lo único que el usuario tendría que hacer es introducir el texto que desea que la voz pronuncie al sistema.

En un documento en el que se detalla el funcionamiento de VALL-E, se explica que el modelo ha sido entrenado con más de 60,000 horas de audio en inglés y que las pruebas realizadas superan a otros modelos TTS (de texto a voz) en términos de naturalidad y similitud con el material original.

¿Para que servirá VALL-E?

La idea de Microsoft es que todas sus soluciones tengan integrada a la inteligencia artificial, así que VALL-E podría estar integrado a Chat GPT-3. Es decir que podría arrojar resultados a las búsquedas a las preguntas que hacemos con voces moldeables y customizables.

La herramienta podría ser utilizada para replicar la voz de alguien que ya no está (por ejemplo, algún actor, actriz o locutor) y facilitarles la vida a los creadores de contenido en sus locuciones.

Por supuesto que, como suele suceder con las soluciones de inteligencia artificial, existe preocupación porque se pudiera hacer mal uso de esta tecnología al atribuirle a alguien cosas que nunca dijo.
Eduardo Scheffler Zawadzki

Entrepreneur Staff

Experto en creación de contenidos

Emprendedores

10 grandes frases sobre el poder de las metas

Establecer metas es el primer paso para lograr algo significativo.

Emprendedores

Los 15 principales emprendedores ESG de 2024

Conoce nuestra lista de los 15 emprendedores ESG más destacados, los innovadores que están salvaguardando nuestro planeta y nuestras comunidades.

Finanzas

Cómo ganar dinero rápido: 10 formas reales de generar ingresos rápidamente

¿Quieres ganar dinero extra lo antes posible? Echa un vistazo a esta lista de diez maneras de generar ingresos rápidamente para inspirarte y comenzar a trabajar.

Mujeres emprendedoras

Innovar para triunfar: Las fundadoras de Agua Bendita explican las claves del éxito detrás de su marca

En el vibrante mundo de los negocios, mantenerse como una marca líder reconocida por el público no es una tarea fácil, especialmente en mercados tan competitivos como la industria de la moda. La marca colombiana, Agua Benidta, ha sabido cómo hacerlo.

Consultoría

8 señales sutiles de que la gente no te respeta — y cómo arreglarlo

Aunque debes ganarte el respeto, no tienes por qué tolerar el desprecio.