Nylig nådde Openai, Goolge IMOs gullmedalje med sine nye eksperimentelle modeller. Men teamet vårt nådde samme nivå med bare o4-mini-high og agentsystemene våre. Og nå åpner vi den. Spesielt fikk vi vanvittige forbedringer med USAMO-benchmarkene. Grunnlinjen var nesten 0, men agenten vår fikk gjennomsnittlig 90 %. Vi kan også teoretisk bevise de nylige arxiv-artiklene som bare gir nøkkelforskningens idé.
84,33K