Estudio de la Universidad de Stanford muestra que ChatGPT es cada vez menos preciso Un grupo de investigadores de la Universidad de Stanford concluyeron que ChatGPT ha empeorado en su habilidad para resolver problemas matemáticos.

MARCO BERTORELLO | Getty Images

La inteligencia artificial (IA) ha ido avanzando a pasos agigantados con el paso del tiempo; sin embargo, parece que, con ChatGPT, el modelo de lenguaje autorregresivo desarrollado por OpenAI, no pasa lo mismo, de acuerdo con un estudio de la Universidad de Stanford, que fue publicado en Twitter por el investigador Matei Zaharia.

Dicha investigación muestra que el chatbot más famoso del mundo tuvo un peor desempeñó en ciertas tareas en junio que en su versión de marzo.

El estudio analizó dos versiones del chatbot de OpenAI durante el período de tiempo: una versión llamada GPT-3.5 y otra conocida como GPT-4.

Fue ahí donde se dieron cuenta de que, en marzo, GPT-4 pudo identificar correctamente que el número 17,077 es un número primo el 97% de las veces de las veces. Pero solo tres meses después, su precisión cayó a 2.4%.

En el caso del modelo 3.5, la versión de marzo respondió correctamente a la misma pregunta solo el 7.4% de las veces, mientras que la versión de junio lo hizo correctamente el 86.8%.

Durante una entrevista con Fortune, James Zou, un profesor de informática de Stanford y uno de los autores del estudio, aseguró que la "magnitud del cambio" fue inesperada.

"Cuando estamos ajustando un gran modelo de lenguaje para mejorar su rendimiento en ciertas tareas, puede tener muchas consecuencias no deseadas, que en realidad podrían perjudicar el rendimiento de este modelo en otras tareas. Hay todo tipo de interdependencias interesantes en la forma en que el modelo responde a las cosas que pueden conducir al empeoramiento de algunos de los comportamientos que observamos", indicó.

El estudio dio cuenta también de que las respuestas de ChatGPT a preguntas delicadas (sobre temas de género o étnicos) se convirtieron en evasivas.

Las primeras versiones del chatbot explicaban detalladamente por qué no podían responder a determinadas preguntas delicadas. En junio, sin embargo, los modelos simplemente se disculparon con el usuario y se negaron a contestar.

Por lo anterior, los líderes de la investigación realizada por la Universidad de Stanford recomiendan a las empresas supervisar los resultados de ChatGPT, sin confiar ciegamente en su capacidad.

Relacionado: Le pedí a la IA que creara un plan estratégico para una empresa ficticia: los resultados me sorprendieron, pero no de la forma en que podrías imaginar
Entrepreneur en Español

Entrepreneur Staff

Noticias

¿Qué pasa con TikTok? Te explicamos por qué la red social podría dejar de operar en Estados Unidos a partir del próximo domingo

La red social enfrenta una posible prohibición en Estados Unidos por preocupaciones de seguridad nacional. La medida obligaría a ByteDance a vender la plataforma a una empresa estadounidense o dejar de operar en el país, afectando a millones de usuarios y creadores de contenido.

Iniciar un negocio

63 ideas de pequeños negocios para iniciar en 2025

Hemos elaborado una lista con las mejores y más rentables ideas de pequeños negocios para que los emprendedores las consideren en 2025.

Noticias

14 maneras fáciles de ganar dinero extra en casa

Un ingreso adicional se siente como ser rico si ya tienes un trabajo diario para cubrir las deudas.

Emprendedores

10 grandes frases sobre el poder de las metas

Establecer metas es el primer paso para lograr algo significativo.

Emprendedores

25 frases inspiradoras para iniciar el 2025

Con cada desafío, hay una lección por aprender. Prepárate para enfrentar el año nuevo con estas 25 frases que te motivarán a crecer, a creer en ti mismo y a nunca rendirte.

Tecnología

Industrias de startups que serán tendencia durante este 2025

Durante 2024, industrias como las fintech, la inteligencia artificial y las criptomonedas lideraron las tendencias. Pero, ¿cuáles impulsarán la próxima generación de startups en 2025? Estas son algunas.