Il modello OpenIA ottiene la medaglia d'oro alle Olimpiadi della Matematica

Il modello OpenIA ottiene la medaglia d'oro alle Olimpiadi della Matematica
Il prototipo di intelligenza artificiale ha risposto a cinque dei sei problemi rivolti agli studenti pre-universitari.
▲ Lo sviluppo di sistemi noti come modelli linguistici di grandi dimensioni ha sorpreso sia gli addetti ai lavori che gli esterni per i grandi progressi nella capacità di comprendere, generare e manipolare la comunicazione umana. Immagine generata con un programma Microsoft.
Monica Mateos
Quotidiano La Jornada, martedì 22 luglio 2025, p. 6
Non appena si è conclusa lo scorso fine settimana in Australia la 66a Olimpiade Internazionale della Matematica (IMO), il ricercatore Alexander Wei della società statunitense OpenIA ha annunciato con grande clamore sul suo account social X che uno dei suoi modelli di intelligenza artificiale (IA) aveva superato la grande sfida
di aggiudicarsi la medaglia d'oro rispondendo correttamente a cinque dei sei problemi posti dalla competizione rivolta agli studenti pre-universitari.
Perché questo è importante?
Wei, dottore di ricerca in informatica presso l'Università della California, Berkeley, si è chiesto, spiegando: in primo luogo, i problemi IMO richiedono un nuovo livello di pensiero creativo costante rispetto ai parametri di riferimento precedenti. In secondo luogo, il progresso in questo ambito richiede di andare oltre il paradigma dell'apprendimento diretto di ricompense chiare e verificabili. In questo modo, abbiamo ottenuto un modello in grado di costruire argomentazioni complesse e robuste, alla pari dei matematici umani
.
La notizia ha sorpreso tutti, soprattutto perché non si aspettavano progressi così rapidi nello sviluppo di sistemi noti come Large Language Models (LLM), addestrati con enormi quantità di dati testuali e codice per comprendere, generare e manipolare il linguaggio umano. Un LLM può svolgere una varietà di compiti, come rispondere a domande, generare testo, tradurre lingue e molto altro.
Proprio l'anno scorso, il colosso inglese Google DeepMind (GDM) ha annunciato che i suoi modelli AlphaProof e AlphaGeometry avevano vinto medaglie d'argento nella più antica e prestigiosa competizione matematica del mondo, a cui partecipano ogni estate giovani provenienti da oltre 100 paesi. Tuttavia, la comunità matematica dell'epoca riteneva che la tecnologia avesse ancora molta strada da fare
per raggiungere i livelli di ragionamento, astrazione e creatività degli esseri umani ( La Jornada , 19/01/24).
Wei ha riferito che per ciascuno dei cinque problemi risolti dal Master in Ragionamento Sperimentale di OpenAI, "tre ex medagliati delle Olimpiadi Internazionali di Matematica hanno valutato in modo indipendente la dimostrazione presentata e i punteggi sono stati ottenuti all'unanimità. Il modello ha ottenuto 35 punti su 42 totali: un punteggio sufficiente per l'oro! Abbiamo valutato i nostri modelli secondo le stesse regole dei concorrenti umani all'IMO 2025: due sessioni d'esame di quattro ore e mezza, senza strumenti né internet, leggendo le dichiarazioni ufficiali dei problemi e scrivendo le dimostrazioni in linguaggio naturale".
Ricerca sperimentale
Congratulazioni infinite al team di Sheryl Hsu e Noam Brown e a tutti i grandi su cui abbiamo fatto affidamento per realizzare questo sogno incredibile! Sono fortunato a poter lavorare fino a tarda notte e fino alle prime ore del mattino insieme ai migliori
, ha detto Wei.
Tuttavia, il ricercatore ha chiarito che, sebbene la versione 5 di GPT Chat sarà rilasciata molto presto, l'IA olimpica "è un modello di ricerca sperimentale. Non prevediamo di rilasciare nulla con questo livello di capacità matematica prima di diversi mesi".
Tuttavia, questo sottolinea la rapidità con cui l'IA ha progredito negli ultimi anni. Nel 2021, il mio relatore di dottorato mi chiese di prevedere i progressi dell'IA in matematica entro luglio 2025. Prevedo un tasso di crescita del 30%; pensavo che tutti gli altri fossero eccessivamente ottimisti. Eppure ora abbiamo una medaglia d'oro olimpica.
Un ex concorrente dell'IMO che ha partecipato all'addestramento dei modelli OpenAI ha spiegato che il problema 6 di quest'anno "riguardava la combinatoria, un'area che di solito richiede maggiore creatività. In altri campi matematici, esistono tecniche per trasformare tutto in algebra; ad esempio, in geometria, si converte tutto in coordinate su un piano e si risolve il problema usando l'algebra, cosa che l'IA già fa. In combinatoria, non è possibile; non ci sono tecniche così comuni e può essere complicato. In questo caso, abbiamo dovuto "inventare" un modo per affrontare e risolvere il problema".
Sul suo account X, Alexander Wei ha caricato le soluzioni del modello ai cinque problemi IMO, affinché chiunque voglia dargli un'occhiata, e ha riconosciuto la presenza su OpenAI di diversi ex atleti olimpici che aiutano nell'addestramento dei modelli: sono alcune delle menti più brillanti del futuro
.
Ernest Ryu, professore di matematica applicata all'Università della California, Los Angeles (UCLA), è stato schietto nell'affermare: "Non credo che gli LLM sostituiranno i matematici tanto presto. La ricerca matematica si concentra sulla risoluzione di problemi che nessuno sa ancora risolvere, e questo richiede una notevole creatività, qualcosa che a mio parere manca in modo particolare nelle soluzioni di OpenAI".
La mia previsione è che nel prossimo decennio un numero crescente di matematici migliorerà la propria produttività utilizzando gli LLM per ricercare parti note di uno schema dimostrativo provvisorio. I matematici più esperti potrebbero lamentarsene, ma i più giovani continueranno semplicemente a fare un buon lavoro.
Cosa succederà dopo, diciamo tra 30 anni? Non ne ho idea. Spero che i matematici (e il lavoro intellettuale umano in generale) non vengano sostituiti dall'intelligenza artificiale, ma nessuno sa cosa succederà. La mia carriera di matematico non è certo minacciata; anzi, spero di sfruttare l'intelligenza artificiale per accelerare il mio lavoro. Tuttavia, non sono sicuro che la generazione di mio figlio si chiamerà ancora "matematici".
Anche Google DeepMind raggiunge il traguardo tanto atteso
Dalla redazione
Quotidiano La Jornada, martedì 22 luglio 2025, p. 6
Google DeepMind ha annunciato ieri che una versione avanzata del suo sistema di intelligenza artificiale (IA) Gemini Deep Think ha ottenuto risultati pari alla medaglia d'oro alle Olimpiadi Internazionali della Matematica (IMO) del 2025 in Australia.
Il sistema di intelligenza artificiale ha risolto perfettamente cinque problemi su sei, ottenendo 35 punti su 42 possibili e raggiungendo la soglia della medaglia d'oro. Questo rappresenta un miglioramento significativo rispetto alla medaglia d'argento ottenuta lo scorso anno, quando i sistemi Google AlphaProof e AlphaGeometry 2 combinati avevano ottenuto solo 28 punti.
Il presidente dell'IMO, Gregor Dolinar, ha confermato il traguardo, affermando: "Google DeepMind ha raggiunto il traguardo tanto atteso, ottenendo 35 punti su 42 possibili: una medaglia d'oro. Le sue soluzioni sono state sorprendenti sotto molti aspetti. I valutatori dell'IMO le hanno trovate chiare, precise e facilissime da seguire".
A differenza dei precedenti tentativi di intelligenza artificiale che richiedevano agli esperti di tradurre i problemi in linguaggi specializzati, questa versione di Gemini operava interamente in linguaggio naturale, producendo dimostrazioni matematiche direttamente dalle dichiarazioni ufficiali dei problemi entro il limite di tempo di quattro ore e mezza della competizione.
La svolta si è avvalsa di una versione avanzata di Gemini Deep Think con capacità di ragionamento avanzate, tra cui il pensiero parallelo
, che consente al modello di esplorare simultaneamente più percorsi di soluzione. Il sistema è stato addestrato per mesi utilizzando nuove tecniche di apprendimento per rinforzo e ha ottenuto l'accesso a soluzioni di alta qualità per problemi matematici.
Sabato, anche la statunitense OpenAI ha annunciato che il suo modello di deep learning ha finalmente vinto la medaglia d'oro nella più grande competizione matematica pre-universitaria del mondo.
jornada