Acusan a Mark Zuckerberg de ordenar el uso de libros pirateados para entrenar Llama Documentos judiciales desclasificados revelan que Meta utilizó contenido protegido por derechos de autor para entrenar su modelo de inteligencia artificial.
Según documentos judiciales publicados recientemente, Mark Zuckerberg autorizó el uso de libros y artículos pirateados para entrenar el modelo de inteligencia artificial Llama. Esta revelación, reportada por TechCrunch, forma parte de la demanda Kadrey vs. Meta, presentada ante una corte federal en California.
Los registros muestran que el equipo de Meta recurrió a LibGen, una base de datos conocida por alojar contenido protegido por derechos de autor de editoriales como McGraw Hill, Pearson y Macmillan. Este repositorio, que ha enfrentado múltiples demandas y órdenes de cierre, fue utilizado para entrenar al menos una versión del modelo Llama, pese a los riesgos legales.
En uno de los correos electrónicos filtrados, empleados de Meta describieron a LibGen como un "conjunto de datos que sabemos que está pirateado" y advirtieron que su uso podría perjudicar la posición de la empresa frente a los reguladores. Sin embargo, según los documentos, la autorización para proceder vino directamente de los niveles más altos de la compañía.
Relacionado: Meta y Mark Zuckerberg anuncian cambios a su sistema de verificación de datos para alinearse con la era Trump
Además, Meta habría intentado encubrir estas acciones. Nikolay Bashlykov, ingeniero del equipo de Llama, desarrolló un script diseñado para eliminar metadatos relacionados con derechos de autor de los libros pirateados. Palabras como copyright y acknowledgments fueron borradas para dificultar la identificación del contenido utilizado durante el entrenamiento.
Los documentos también señalan que Meta descargó los archivos de LibGen a través de torrents, una práctica que implica compartir archivos con otros usuarios de la red, convirtiendo a la compañía en un distribuidor activo de contenido pirateado.
Estas prácticas generaron preocupaciones internas entre los ingenieros de Meta. Sin embargo, las advertencias fueron ignoradas por Ahmad Ah-Dahle, jefe de IA generativa en la empresa.
Los abogados de los demandantes acusan a Meta de violar deliberadamente derechos de autor y de intentar ocultar pruebas. El juez Vince Chhabria, encargado del caso, rechazó la solicitud de Meta para mantener partes de los documentos bajo secreto, argumentando que el objetivo parecía ser evitar una mala publicidad más que proteger información confidencial.
Hasta el momento, Meta no ha emitido comentarios sobre estas acusaciones tras la publicación de los documentos.
Relacionado: Mark Zuckerberg lima asperezas con Donald Trump. Meta dona $1 millón de dólares al fondo inaugural del presidente electo