Prestazione da medaglia d'oro all'Olimpiade Internazionale di Matematica 2025 dal nostro ultimo LLM di ragionamento sperimentale. Il modello ha operato in linguaggio naturale (cioè produce dimostrazioni in linguaggio naturale) secondo le stesse regole degli esseri umani (ad esempio, 4,5 ore per sessione, senza strumenti). Traguardo straordinario!
Alexander Wei
Alexander Wei19 lug, 15:50
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).
Ciò che è più notevole è che questo sistema utilizza un approccio molto generale, impiegando l'apprendimento per rinforzo e la scalabilità del calcolo durante il test:
Alexander Wei
Alexander Wei19 lug, 15:50
5/N Oltre al risultato stesso, sono entusiasta del nostro approccio: raggiungiamo questo livello di capacità non attraverso una metodologia ristretta e specifica per compiti, ma aprendo nuove strade nell'apprendimento per rinforzo di uso generale e nella scalabilità del calcolo durante il test.
107,49K