Goldmedaille-niveau Leistung bei der Internationalen Mathematik-Olympiade 2025 von unserem neuesten experimentellen reasoning LLM. Das Modell arbeitete in natürlicher Sprache (d.h. gibt Beweise in natürlicher Sprache aus) unter denselben Regeln wie Menschen (z.B. 4,5 Stunden pro Sitzung, keine Werkzeuge). Erstaunlicher Meilenstein!
Alexander Wei
Alexander Wei19. Juli, 15:50
1/N Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-LLM von @OpenAI eine langjährige große Herausforderung in der KI erreicht hat: eine Goldmedaille auf dem weltweit prestigeträchtigsten Mathematikwettbewerb – der Internationalen Mathematik-Olympiade (IMO).
Das Bemerkenswerteste ist, dass dieses System einen sehr allgemeinen Ansatz verwendet, der auf Verstärkungslernen und der Skalierung der Rechenleistung zur Testzeit basiert:
Alexander Wei
Alexander Wei19. Juli, 15:50
Neben dem Ergebnis selbst bin ich begeistert von unserem Ansatz: Wir erreichen dieses Fähigkeitsniveau nicht durch enge, aufgabenbezogene Methodik, sondern indem wir Neuland im allgemeinen Verstärkungslernen und in der Skalierung der Rechenleistung zur Testzeit betreten.
116,82K