Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/N Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-LLM von @OpenAI eine langjährige große Herausforderung in der KI erreicht hat: eine Goldmedaille auf dem weltweit prestigeträchtigsten Mathematikwettbewerb – der Internationalen Mathematik-Olympiade (IMO).

2/N Wir haben unsere Modelle anhand der IMO-Probleme 2025 unter denselben Regeln wie die menschlichen Teilnehmer bewertet: zwei Prüfungsabschnitte von 4,5 Stunden, keine Werkzeuge oder Internet, Lesen der offiziellen Problemstellungen und Schreiben von Beweisen in natürlicher Sprache.

4/N Zweitens sind IMO-Einreichungen schwer zu verifizieren und bestehen aus mehreren Seiten Beweisen. Fortschritte hier erfordern, über das RL-Paradigma von klaren, verifizierbaren Belohnungen hinauszugehen. Dadurch haben wir ein Modell erhalten, das in der Lage ist, komplexe, wasserdichte Argumente auf dem Niveau menschlicher Mathematiker zu formulieren.




Neben dem Ergebnis selbst bin ich begeistert von unserem Ansatz: Wir erreichen dieses Fähigkeitsniveau nicht durch enge, aufgabenbezogene Methodik, sondern indem wir Neuland im allgemeinen Verstärkungslernen und in der Skalierung der Rechenleistung zur Testzeit betreten.
6/N In unserer Bewertung hat das Modell 5 der 6 Probleme bei der IMO 2025 gelöst. Für jedes Problem haben drei ehemalige IMO-Medaillengewinner unabhängig die eingereichte Beweisführung des Modells bewertet, wobei die Punkte nach einstimmigem Konsens finalisiert wurden. Das Modell erzielte insgesamt 35/42 Punkte, genug für Gold! 🥇
8/N Übrigens, wir werden bald GPT-5 veröffentlichen, und wir sind gespannt darauf, dass ihr es ausprobiert. Aber um es klarzustellen: Das IMO Gold LLM ist ein experimentelles Forschungsmodell. Wir planen nicht, in den nächsten Monaten etwas mit diesem mathematischen Leistungsniveau zu veröffentlichen.
9/N Dennoch – das unterstreicht, wie schnell sich KI in den letzten Jahren entwickelt hat. 2021 hatte mich mein Doktorvater @JacobSteinhardt gebeten, den Fortschritt der KI in der Mathematik bis Juli 2025 vorherzusagen. Ich sagte 30 % beim MATH-Benchmark voraus (und dachte, alle anderen seien zu optimistisch). Stattdessen haben wir IMO-Gold.

11/N Schließlich möchten wir allen Teilnehmern der IMO 2025 zu ihrem Erfolg gratulieren! Wir sind stolz darauf, viele ehemalige IMO-Teilnehmer bei @OpenAI zu haben und erkennen an, dass dies einige der hellsten jungen Köpfe der Zukunft sind.
1,12M
Top
Ranking
Favoriten