Gratulacje dla zespołu GDM za ich wynik IMO! Myślę, że ich równoległy sukces podkreśla, jak szybki jest postęp w AI. Ich podejście było nieco inne niż nasze, ale myślę, że to pokazuje, że istnieje wiele kierunków badań dla dalszego postępu. Kilka myśli na temat naszego modelu i wyników 🧵
~2 miesiące temu IMO wysłało do nas e-maila w sprawie uczestnictwa w formalnej (Lean) wersji IMO. Skupiliśmy się na ogólnym rozumowaniu w naturalnym języku bez ograniczeń Lean, więc odmówiliśmy. Nigdy nie zaproponowano nam opcji matematyki w naturalnym języku.
W ciągu ostatnich kilku miesięcy poczyniliśmy duże postępy w zakresie ogólnego rozumowania. Polegało to na zbieraniu, kuratowaniu i szkoleniu na wysokiej jakości danych matematycznych, które również trafią do przyszłych modeli. W naszej ocenie IMO nie używaliśmy RAG ani żadnych narzędzi.
Zanim podzieliliśmy się naszymi wynikami, rozmawialiśmy z członkiem zarządu IMO, który poprosił nas, abyśmy poczekali z ogłoszeniem tego do zakończenia ceremonii wręczenia nagród, prośbę, którą z radością spełniliśmy.
Ogłosiliśmy to około 1:00 w nocy PT (18:00 AEST), po zakończeniu ceremonii wręczenia nagród. W żadnym momencie nikt nie prosił, aby ogłosić to później.
Bardziej niż cokolwiek innego, cieszymy się, że możemy podzielić się naszymi postępami i wynikami ze światem. Możliwości rozumowania AI rozwijają się szybko, a te wyniki IMO naprawdę to pokazują.
129,97K