熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我們的常駐 @delphi_intel 建設者 @lex_feeds 又帶來了一個精彩的作品
如果你還沒關注他,快去關注吧

7月20日 01:50
我在兩天前還以為人類是安全的,這真的是以天來計算……
一些背景:這不是人工智慧第一次在國際數學奧林匹亞(IMO)中獲獎。去年,谷歌的 AlphaProof 獲得了銀牌——但那個模型是專門為數學訓練的。
這一次,OpenAI 使用了一個通用模型(可能是內部的 GPT-5 原型?),並且獲得了金牌。這是一個重大的飛躍。
為了讓這個情況更具體:解決一個 IMO 水準的問題通常需要精英人類競爭者大約 100 分鐘。就在兩年前,頂尖的 AI 模型仍在與小學的文字問題(GSM8k)作鬥爭,而這些問題人類大約需要 10 秒鐘來解決。
正如 OpenAI 的 Dan Roberts 在 Sequoia 的 AI Ascent 2025 中分享的,AI 能夠處理的任務長度每 7 個月就會翻倍。到 2025 年底,GPT-5 很可能會在小時級別的人類任務水平上運作。
一個警告:據報導,今年的 IMO 在難度平衡上存在缺陷——問題 1-5 相對容易,而問題 6 異常困難。因此,許多分數集中在 28-35 之間(每個問題值 7 分)。AI 得到了 35 分——剛好夠拿金牌。這有點運氣,但這個趨勢是不可否認的。
最後,數學競賽無疑將成為中國的中國人、美國的中國人和 AI 模型(由美國和中國的中國人建造)之間的競賽。
2.35K
熱門
排行
收藏