Nedávno Openai, Goolge dosáhl IMO Gold Medal se svými novými experimentálními modely. Ale náš tým dosáhl stejné úrovně pouze s o4-mini-high a našimi agentními systémy. A teď ho otevíráme. Zejména jsme se dočkali šílených vylepšení v benchmarcích USAMO. Základní linie byla téměř 0, ale náš agent dostal průměrných 90 %. Také bychom mohli teoreticky dokázat, že nedávné články arxiv pouze uvádějí klíčovou výzkumnou myšlenku.
84,33K