我們可能正朝著 OpenAI 與 DeepMind IMO 之間的情節轉折前進。 剛看到 Joseph Myers 的一篇帖子(自 1992 年以來參與數學奧林匹克):IMO 委員會據報要求 AI 實驗室在閉幕式後的 7 天內不要公布結果——出於對人類參賽者的尊重(參見我昨天的帖子),並可能是為了給予適當驗證 AI 提交和格式的時間。 根據 Joseph 的說法,OpenAI 沒有與 IMO 合作測試他們的模型,91 位官方 IMO 協調員中也沒有參與評分其解答。與此同時,DeepMind 似乎遵循規則,耐心等待他們的輪到。 背景資訊: IMO 有 6 道題目,每道題目值 7 分。今年的金牌截止分數是 35 分。即使是小的扣分也可能讓 OpenAI 降到銀牌。根據我對他們的寫作的理解,有些部分可能會引發問題——並可能扣分。 Terence Tao 也指出,雖然題目保持不變,但測試格式很重要。在標準條件下不會獲得銅牌的學生,可能在修改的設置下獲得金牌——這引發了關於 AI "解決 IMO" 的真正問題。 下週可能會變得火熱。敬請關注。
Jasper
Jasper7月20日 03:15
DeepMind 在週五下午於國際數學奧林匹克(IMO)獲得金牌。但他們必須等到市場部批准推文——直到週一。 @OpenAI 在週六凌晨1點首先分享了他們的消息,搶走了風頭。 在這場比賽中,速度 > 官僚主義。錯過時機,就會失去敘事。
@swierk 他們找到三位前國際數學奧林匹克(IMO)獎牌得主,但並非官方的IMO協調員: “對於每個問題,三位前IMO獎牌得主獨立評分模型提交的證明,分數在達成一致共識後最終確定。”
Alexander Wei
Alexander Wei7月19日 15:50
在我們的評估中,該模型解決了2025年國際數學奧林匹克(IMO)中的6個問題中的5個。對於每個問題,三位前IMO獲獎者獨立評分模型提交的證明,最終分數在一致同意後確定。該模型總共獲得了35/42分,足以獲得金牌!🥇
我之前關於IMO委員會要求的帖子
Jasper
Jasper7月20日 05:42
澄清:我聽說過 Google 的某位人士表示,他們的 IMO 結果仍在內部驗證中。一旦完成,他們計劃正式分享這些結果——我很好奇他們的做法。 另一個消息來源提到,IMO 委員會要求在閉幕式後的一周內不要公開討論 AI 的參與。事情變得更加有趣了 🧐
@GoogleDeepMind 超人類推理團隊負責人 @lmthang 也提出了 OpenAI 是否會贏得金牌或銀牌的問題。
Jasper
Jasper7月20日 05:42
澄清:我聽說過 Google 的某位人士表示,他們的 IMO 結果仍在內部驗證中。一旦完成,他們計劃正式分享這些結果——我很好奇他們的做法。 另一個消息來源提到,IMO 委員會要求在閉幕式後的一周內不要公開討論 AI 的參與。事情變得更加有趣了 🧐
@GoogleDeepMind 超人類推理團隊負責人 @lmthang 建造了 AlphaGeometry,還提出了 OpenAI 會贏得金牌還是銀牌的問題。
Thang Luong
Thang Luong19 小時前
是的,IMO 組織者有一個官方的評分指導方針,但這些指導方針並不對外公開。在沒有根據該指導方針進行評估的情況下,無法提出獎牌申請。扣除一分後,這是銀牌,而不是金牌。
@swierk 是的,數學和人工智慧領域的人提出的問題越來越多。
Jasper
Jasper15 小時前
@GoogleDeepMind 超人類推理團隊負責人 @lmthang 建造了 AlphaGeometry,還提出了 OpenAI 會贏得金牌還是銀牌的問題。
87.31K