Regarder le modèle résoudre ces problèmes IMO et atteindre des performances de niveau or était magique. Quelques réflexions 🧵
Alexander Wei
Alexander Wei19 juil., 15:50
1/N Je suis ravi de partager que notre dernier LLM expérimental de raisonnement @OpenAI a atteint un défi de longue date en IA : une performance de niveau médaille d'or lors de la compétition mathématique la plus prestigieuse au monde - l'Olympiade Internationale de Mathématiques (IMO).
Le modèle résout ces problèmes sans outils comme lean ou le codage, il utilise simplement le langage naturel, et n'a également que 4,5 heures. Nous voyons le modèle raisonner à un niveau très élevé - essayant différentes stratégies, faisant des observations à partir d'exemples et testant des hypothèses.
C'est fou comme nous sommes passés de 12 % sur AIME (GPT 4o) → IMO or en ~ 15 mois. Nous avons parcouru un long chemin très rapidement. Je ne serais pas surpris si d'ici l'année prochaine, les modèles dérivent de nouveaux théorèmes et contribuent à la recherche mathématique originale !
487,12K