Het was magisch om het model deze IMO-problemen te zien oplossen en een gouden niveau van prestaties te bereiken. Een paar gedachten 🧵
Alexander Wei
Alexander Wei19 jul, 15:50
1/N Ik ben enthousiast om te delen dat onze nieuwste @OpenAI experimentele redeneermodule (LLM) een langdurige grote uitdaging in AI heeft bereikt: goudmedaille-niveau prestaties op de meest prestigieuze wiskundewedstrijd ter wereld—de Internationale Wiskunde Olympiade (IMO).
Het model lost deze problemen op zonder tools zoals lean of coderen, het gebruikt gewoon natuurlijke taal, en heeft ook maar 4,5 uur. We zien het model op een zeer hoog niveau redeneren - verschillende strategieën uitproberen, observaties maken uit voorbeelden en hypothesen testen.
Het is gek hoe we in ~ 15 maanden van 12% op AIME (GPT 4o) → IMO goud zijn gegaan. We zijn heel ver gekomen, heel snel. Het zou me niet verbazen als modellen volgend jaar nieuwe stellingen afleiden en bijdragen aan origineel wiskundig onderzoek!
487,12K