Gouden medaille-niveau prestaties op de Internationale Wiskunde Olympiade 2025 van ons nieuwste experimentele redeneermodel. Model werkte in natuurlijke taal (d.w.z. genereert natuurlijke taal bewijzen) onder dezelfde regels als mensen (bijv. 4,5 uur per sessie, geen hulpmiddelen). Geweldig mijlpaal!
Alexander Wei
Alexander Wei19 jul, 15:50
1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).
Wat het meest opmerkelijk is, is dat dit systeem een zeer algemene benadering gebruikt, met gebruik van versterkend leren en opschaling van de rekentijd tijdens tests:
Alexander Wei
Alexander Wei19 jul, 15:50
5/N Besides the result itself, I am excited about our approach: We reach this capability level not via narrow, task-specific methodology, but by breaking new ground in general-purpose reinforcement learning and test-time compute scaling.
122,03K