恭喜 GDM 團隊在 IMO 的成果!我認為他們的平行成功突顯了 AI 進步的速度。他們的方法與我們的有些不同,但我認為這顯示出有許多研究方向可以進一步發展。對我們的模型和結果的一些想法 🧵
大約兩個月前,IMO給我們發送了電子郵件,邀請我們參加IMO的正式(Lean)版本。我們一直專注於自然語言中的一般推理,而不受Lean的限制,因此我們拒絕了。我們從未被詢問過有關自然語言數學選項的事宜。
在過去幾個月中,我們在一般推理方面取得了很大進展。這涉及收集、策劃和訓練高質量的數學數據,這些數據也將用於未來的模型。在我們的IMO評估中,我們沒有使用RAG或任何工具。
在我們分享結果之前,我們與一位IMO董事會成員交談,他要求我們等到頒獎典禮結束後再公開這些結果,我們欣然遵從了這一要求。
我們在太平洋時間凌晨1點(澳洲東部標準時間下午6點)宣布,頒獎典禮結束後。任何時候都沒有人要求我們晚點宣布。
最重要的是,我們很高興能與世界分享我們的進展和成果。人工智慧的推理能力正在快速進步,而這些 IMO 的結果確實顯示了這一點。
252.48K