1/N 我很高興地分享,我們最新的 @OpenAI 實驗性推理 LLM 在人工智慧領域達成了一項長期以來的重大挑戰:在世界上最具聲望的數學競賽——國際數學奧林匹克(IMO)中獲得金牌級別的表現。
4/N 第二,IMO 提交的內容是難以驗證的多頁證明。在這方面的進展需要超越 RL 範式的明確、可驗證的獎勵。通過這樣做,我們獲得了一個能夠在與人類數學家相當的水平上構建複雜、無懈可擊的論證的模型。
除了結果本身,我對我們的方法感到興奮:我們達到這一能力水平不是通過狹窄的、特定任務的方法,而是通過在通用強化學習和測試時計算擴展方面開創新局。
8/N 順便提一下,我們即將推出 GPT-5,我們很高興你能試用它。但為了澄清:IMO gold LLM 是一個實驗性研究模型。我們不打算在幾個月內發布任何具有這種數學能力的產品。
9/N 仍然——這突顯了人工智慧在近年來的快速進步。在2021年,我的博士生導師 @JacobSteinhardt 讓我預測到2025年7月的人工智慧數學進展。我預測在 MATH 基準上達到30%(並認為其他人過於樂觀)。然而,我們卻獲得了 IMO 金牌。
最後,我們要祝賀2025年國際數學奧林匹克的所有參賽者,恭喜你們的成就!我們為有許多過去的IMO參賽者在@OpenAI工作而感到自豪,並認識到這些都是未來最聰明的年輕頭腦之一。
131.56K