Es war magisch, das Modell zu beobachten, wie es diese IMO-Probleme löst und eine Gold-Leistungsstufe erreicht. Ein paar Gedanken 🧵
Alexander Wei
Alexander Wei19. Juli, 15:50
1/N Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-LLM von @OpenAI eine langjährige große Herausforderung in der KI erreicht hat: eine Goldmedaille auf dem weltweit prestigeträchtigsten Mathematikwettbewerb – der Internationalen Mathematik-Olympiade (IMO).
Das Modell löst diese Probleme ohne Werkzeuge wie Lean oder Programmierung, es verwendet einfach natürliche Sprache und hat auch nur 4,5 Stunden. Wir sehen, dass das Modell auf einem sehr hohen Niveau denkt - verschiedene Strategien ausprobiert, Beobachtungen aus Beispielen macht und Hypothesen testet.
Es ist verrückt, wie wir von 12 % bei AIME (GPT 4o) → IMO Gold in etwa 15 Monaten gekommen sind. Wir sind sehr schnell sehr weit gekommen. Es würde mich nicht überraschen, wenn Modelle bis nächstes Jahr neue Theoreme ableiten und zur ursprünglichen mathematischen Forschung beitragen!
437,96K