Výkon na úrovni zlaté medaile na Mezinárodní matematické olympiádě 2025 z našeho nejnovějšího experimentálního uvažování LLM. Model provozovaný v přirozeném jazyce (tj. výstupem jsou korektury v přirozeném jazyce) podle stejných pravidel jako lidé (např. 4,5 hodiny na relaci, žádné nástroje). Úžasný milník!
Alexander Wei
Alexander Wei19. 7. 15:50
1/N S potěšením se s vámi podělím o to, že naše nejnovější @OpenAI experimentální uvažování LLM dosáhlo dlouhodobé velké výzvy v oblasti umělé inteligence: výkonu na úrovni zlaté medaile na nejprestižnější matematické soutěži na světě – Mezinárodní matematické olympiádě (IMO).
Nejpozoruhodnější je, že tento systém používá velmi obecný přístup, který využívá zpětnovazební učení a škálování výpočtů testovacího času:
Alexander Wei
Alexander Wei19. 7. 15:50
5/N Kromě samotného výsledku jsem nadšený z našeho přístupu: Této úrovně schopností nedosahujeme prostřednictvím úzké metodologie specifické pro daný úkol, ale průlomem na novou půdu v obecném zpětnovazebním učení a škálování výpočtů v době testu.
107,49K