Los humanos vencieron a la IA en la Olimpiada Anual de Matemáticas, pero las máquinas los están alcanzando

/ CBS/AFP
Sydney — Los humanos superaron a los modelos de IA generativos creados por Google y OpenAI en una importante competencia internacional de matemáticas, pero los programas alcanzaron puntajes de nivel oro por primera vez, y el ritmo al que están mejorando puede ser motivo de cierta introspección humana.
Ninguno de los modelos de IA obtuvo la puntuación máxima, a diferencia de cinco jóvenes en la Olimpiada Internacional de Matemáticas (OIM), una prestigiosa competición anual en la que los participantes deben ser menores de 20 años.
Google dijo el lunes que una versión avanzada de su chatbot Gemini había resuelto cinco de los seis problemas de matemáticas planteados en la OMI, celebrada este mes en Queensland, Australia.
"Podemos confirmar que Google DeepMind ha alcanzado el ansiado hito, obteniendo 35 de los 42 puntos posibles: una medalla de oro", declaró el gigante tecnológico estadounidense, citando al presidente de IMO, Gregor Dolinar. "Sus soluciones fueron sorprendentes en muchos aspectos. Los evaluadores de IMO las consideraron claras, precisas y, en su mayoría, fáciles de seguir".
Alrededor del 10% de los concursantes humanos ganaron medallas de oro y cinco recibieron puntuaciones perfectas de 42 puntos.
OpenAI, el fabricante estadounidense de ChatGPT, afirmó que su modelo de razonamiento experimental también obtuvo 35 puntos, nivel oro, en la prueba.
El resultado "superó un gran desafío de larga data en IA" en "la competencia de matemáticas más prestigiosa del mundo", dijo el investigador de OpenAI, Alexander Wei, en una publicación en las redes sociales.
"Evaluamos nuestros modelos en los problemas de la OMI de 2025 con las mismas reglas que los participantes humanos", dijo. "Para cada problema, tres exmedallistas de la OMI calificaron de forma independiente la prueba presentada por el modelo".
Google obtuvo una medalla de plata en la IMO del año pasado en la ciudad de Bath, en el suroeste de Inglaterra, resolviendo cuatro de los seis problemas.
Eso tomó de dos a tres días de cálculo, mucho más tiempo que este año, cuando su modelo Gemini resolvió los problemas dentro del límite de tiempo de 4,5 horas, dijo.
La OMI afirmó que las empresas tecnológicas habían "probado de forma privada modelos de inteligencia artificial de código cerrado sobre los problemas de este año", los mismos que enfrentaron 641 estudiantes competidores de 112 países.
"Es muy emocionante ver avances en las capacidades matemáticas de los modelos de IA", afirmó el presidente de la OMI, Dolinar.
Los organizadores del concurso no pudieron verificar cuánta potencia informática habían utilizado los modelos de IA ni si hubo participación humana, señaló.
En una entrevista con el programa 60 Minutes de CBS a principios de este año, uno de los principales investigadores de IA de Google predijo que dentro de solo cinco a diez años, se fabricarían computadoras con capacidades cognitivas a nivel humano, un hito conocido como "inteligencia general artificial".
Demis Hassabis, CEO de Google DeepMind, predijo que la tecnología de IA estaba en camino de comprender el mundo de formas matizadas y no solo de resolver problemas importantes, sino incluso de desarrollar un sentido de imaginación, dentro de una década, gracias a un aumento en la inversión.
"Está avanzando increíblemente rápido", dijo Hassabis. "Creo que estamos en una especie de curva de mejora exponencial. Por supuesto, el éxito del campo en los últimos años ha atraído aún más atención, más recursos y más talento. Así que eso contribuye a este progreso exponencial".
Cbs News