熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們最新的實驗性推理 LLM 在 2025 年國際數學奧林匹克比賽中表現出金牌級的水準。
模型在自然語言下運作(即輸出自然語言證明),遵循與人類相同的規則(例如每次會議 4.5 小時,無工具)。
驚人的里程碑!

7月19日 15:50
1/N 我很高興地分享,我們最新的 @OpenAI 實驗性推理 LLM 在人工智慧領域達成了一項長期以來的重大挑戰:在世界上最具聲望的數學競賽——國際數學奧林匹克(IMO)中獲得金牌級別的表現。

最引人注目的是,這個系統採用了一種非常通用的方法,使用強化學習和測試時間計算的擴展:

7月19日 15:50
除了結果本身,我對我們的方法感到興奮:我們達到這一能力水平不是通過狹窄的、特定任務的方法,而是通過在通用強化學習和測試時計算擴展方面開創新局。
107.49K
熱門
排行
收藏