Pensavo che l'umanità fosse al sicuro solo 2 giorni fa, si conta letteralmente in giorni… Un po' di contesto: questa non è la prima volta che l'IA ha vinto una medaglia all'International Math Olympiad (IMO). L'anno scorso, AlphaProof di Google ha vinto l'argento, ma quel modello era stato addestrato specificamente per la matematica. Questa volta, OpenAI ha utilizzato un modello di uso generale (probabilmente un prototipo interno di GPT-5?), e ha vinto l'oro. Questo è un enorme passo in avanti in significato. Per mettere tutto in prospettiva: risolvere un problema di livello IMO richiede tipicamente ai concorrenti umani d'élite circa 100 minuti. Solo 2 anni fa, i migliori modelli di IA stavano ancora lottando con problemi di parole di scuola elementare (GSM8k), che richiedono agli esseri umani circa 10 secondi per essere risolti. Come ha condiviso Dan Roberts di OpenAI al Sequoia’s AI Ascent 2025, la lunghezza dei compiti che l'IA può gestire raddoppia ogni 7 mesi. Entro la fine del 2025, GPT-5 potrebbe operare a livelli di compiti umani di un'ora. Una nota: si dice che l'IMO di quest'anno avesse un difetto nell'equilibrio di difficoltà: i problemi 1-5 erano relativamente facili, mentre il problema 6 era insolitamente difficile. Di conseguenza, molti punteggi si sono concentrati tra 28 e 35 (ogni problema vale 7 punti). L'IA ha ottenuto un 35, giusto sufficiente per l'oro. Un po' di fortuna, ma la traiettoria è innegabile. Ultimo ma non meno importante, le competizioni matematiche saranno senza dubbio una corsa tra cinesi in Cina, cinesi negli Stati Uniti e modelli di IA (costruiti da cinesi negli Stati Uniti e in Cina).
Alexander Wei
Alexander Wei19 lug, 15:50
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).
5,45K