OpenAI se quedó sin datos y utilizó millones de horas de videos de YouTube para entrenar a uno de sus modelos de IA Según un informe de The New York Times, la empresa encabezada por Sam Altman utilizó sin consentimiento alguno contenido de la plataforma de streaming.
Por Entrepreneur en Español Editado por Eduardo Scheffler Zawadzki
Según una investigación realizada por The New York Times, OpenAI habría empleado más de un millón de horas de vídeos de YouTube para el entrenamiento de Whisper, un sistema diseñado para convertir audio en texto.
Tras estos acontecimientos, Google reaccionó acusando que esta actividad podría violar los términos y condiciones de sus productos, especialmente por tratarse de contenido protegido.
A pesar de ello, OpenAI justificó su acción bajo el concepto de "uso razonable", argumentando que solo utilizaron una fracción de la vasta cantidad de vídeos disponibles en la plataforma de streaming más grande del mundo.
Según la investigación del NYT, el presidente de OpenAI, Greg Brockman, estuvo involucrado en la adquisición de estos datos.
Google ha respondido a estas acusaciones señalando que sus políticas prohíben el scraping o la descarga no autorizada de contenido de YouTube, lo que sugiere una posible violación por parte de OpenAI.
De acuerdo con The Verge, OpenAI, junto con otras empresas dedicadas al desarrollo de la IA, ha agotado la totalidad de los datos públicos disponibles para entrenar sus diferentes modelos.
Ante esta situación, la empresa liderada por Sam Altman aprovechó vacíos legales y optó por hacer uso de vídeos, podcasts y audiolibros.
Fue entonces cuando decidió utilizar millones de horas de videos de YouTube que se encuentran alojados en los servidores de Google.
Esta no es la primera vez que OpenAI es acusada de utilizar material de otras empresas sin consentimiento para entrenar a sus diversos modelos de IA.
De hecho, el 28 de diciembre de 2024, The New York Times demandó a OpenAI y exigió una indemnización por el uso de su información para mejorar a ChatGPT. El diario norteamericano asegura que se utilizó el material editorial sin su consentimiento.
Relacionado: OpenAI responde a la demanda del New York Times y asegura que "carece de fundamento"