No incluso bronce: Evaluando LLMs en la Olimpiada Internacional de Matemáticas 2025 🥉 Buen artículo del equipo detrás de MathArena: Evaluando LLMs en Competencias Matemáticas No Contaminadas () proporcionando un análisis independiente del rendimiento de LLM en la OIM.
Parece una versión avanzada de Gemini con Deep Think que acaba de resolver 5 de los 6 problemas IMO, ganando un total de 35 puntos y logrando oficialmente un rendimiento de nivel medalla de oro. ¡Felicidades por el logro @lmthang❗️ No puedo esperar para jugar con este modelo.
42,49K