熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
DeepMind 在週五下午於國際數學奧林匹克(IMO)獲得金牌。但他們必須等到市場部批准推文——直到週一。
@OpenAI 在週六凌晨1點首先分享了他們的消息,搶走了風頭。
在這場比賽中,速度 > 官僚主義。錯過時機,就會失去敘事。
澄清:我聽說過 Google 的某位人士表示,他們的 IMO 結果仍在驗證中。一旦這個過程完成,他們計劃正式分享這些結果。期待看到他們的做法。
澄清:我聽說過 Google 的某位人士表示,他們的 IMO 結果仍在內部驗證中。一旦完成,他們計劃正式分享這些結果——我很好奇他們的做法。
另一個消息來源提到,IMO 委員會要求在閉幕式後的一周內不要公開討論 AI 的參與。事情變得更加有趣了 🧐
@OpenAI 這裡有一些更新

9 小時前
我們可能正朝著 OpenAI 與 DeepMind IMO 之間的情節轉折前進。
剛看到 Joseph Myers 的一篇帖子(自 1992 年以來參與數學奧林匹克):IMO 委員會據報要求 AI 實驗室在閉幕式後的 7 天內不要公布結果——出於對人類參賽者的尊重(參見我昨天的帖子),並可能是為了給予適當驗證 AI 提交和格式的時間。
根據 Joseph 的說法,OpenAI 沒有與 IMO 合作測試他們的模型,91 位官方 IMO 協調員中也沒有參與評分其解答。與此同時,DeepMind 似乎遵循規則,耐心等待他們的輪到。
背景資訊:
IMO 有 6 道題目,每道題目值 7 分。今年的金牌截止分數是 35 分。即使是小的扣分也可能讓 OpenAI 降到銀牌。根據我對他們的寫作的理解,有些部分可能會引發問題——並可能扣分。
Terence Tao 也指出,雖然題目保持不變,但測試格式很重要。在標準條件下不會獲得銅牌的學生,可能在修改的設置下獲得金牌——這引發了關於 AI "解決 IMO" 的真正問題。
下週可能會變得火熱。敬請關注。


214.97K
熱門
排行
收藏