Obserwowanie, jak model rozwiązuje te problemy IMO i osiąga złoty poziom wydajności, było magiczne. Kilka myśli 🧵
Alexander Wei
Alexander Wei19 lip, 15:50
1/N Cieszę się, że mogę podzielić się informacją, że nasz najnowszy eksperymentalny model LLM @OpenAI osiągnął długo oczekiwane wyzwanie w AI: poziom złotego medalu w najbardziej prestiżowych zawodach matematycznych na świecie—Międzynarodowej Olimpiadzie Matematycznej (IMO).
Model rozwiązuje te problemy bez narzędzi takich jak lean czy kodowanie, używa tylko języka naturalnego i ma zaledwie 4,5 godziny. Widzimy, jak model myśli na bardzo wysokim poziomie - próbuje różnych strategii, dokonuje obserwacji na podstawie przykładów i testuje hipotezy.
To szalone, jak przeszliśmy z 12% na AIME (GPT 4o) → IMO złoto w ciągu ~ 15 miesięcy. Zrobiliśmy ogromne postępy w bardzo krótkim czasie. Nie zdziwiłbym się, gdyby w przyszłym roku modele zaczęły wyprowadzać nowe twierdzenia i przyczyniać się do oryginalnych badań matematycznych!
487,12K