Ver al modelo resolver estos problemas de la OMI y lograr un rendimiento de nivel oro fue mágico. Algunas reflexiones 🧵
Alexander Wei
Alexander Weihace 22 horas
1/N Me complace compartir que nuestro último @OpenAI LLM de razonamiento experimental ha logrado un gran desafío de larga data en IA: el rendimiento a nivel de medalla de oro en la competencia de matemáticas más prestigiosa del mundo: la Olimpiada Internacional de Matemáticas (IMO).
El modelo resuelve estos problemas sin herramientas como lean o codificación, solo usa lenguaje natural y también solo tiene 4.5 horas. Vemos la razón del modelo a un nivel muy alto: probando diferentes estrategias, haciendo observaciones a partir de ejemplos y probando hipótesis.
Es una locura cómo hemos pasado del 12% en AIME (GPT 4o) → IMO gold en ~ 15 meses. Hemos llegado muy lejos muy rápidamente. ¡No me sorprendería si para el próximo año los modelos derivan nuevos teoremas y contribuyen a la investigación matemática original!
394.93K