Pas même en bronze : Évaluation des LLM sur l'Olympiade Internationale de Mathématiques 2025 🥉 Un excellent article de blog de l'équipe derrière MathArena : Évaluation des LLM sur des compétitions mathématiques non contaminées () fournissant une analyse indépendante des performances des LLM sur l'OIM.
On dirait une version avancée de Gemini avec Deep Think qui vient de résoudre 5 des 6 problèmes IMO, gagnant un total de 35 points, et atteignant officiellement un niveau de performance de médaille d'or. Félicitations pour cet accomplissement @lmthang❗️ J'ai hâte de jouer avec ce modèle.
42,48K