熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Peter Wildeford (hiring!) 🇺🇸🚀
全球排名前 20 位的預測者 🎯
AI 越來越強大。社會還沒有做好準備。在 @IAPSai 工作,塑造 AI 以實現繁榮和人類自由。
要確定 OpenAI 和 Google DeepMind 是否真的獲得了 IMO 金獎的 "公平競爭",實在是出乎意料的困難。期待更多的分析。

Jasper Dekoninck14 小時前
有趣的方法!然而,我們查看了證據和方法論,發現了一些問題,特別是在給模型的提示使用上。雖然支架確實提高了性能,但並未準確解決所有問題,也不會獲得金牌。🧵
1.1K
> 5 吉瓦的 Stargate AI 數據中心容量
> 超過 200 萬顆晶片
如果這些是 GB200,那將是 500 萬 H100 等效品。如果全部用於訓練一個模型,這將是 2e28-4e28 FLOP 的六個月預訓練 + RLVR 運行。這將是 GPT4 使用的計算量的 1000 倍。
我們無法得知這個建設的時間表,但我猜會晚於 2027 年。我猜到 2026 年底,最好的模型將會是 ~2e27 的計算量。

OpenAI11 小時前
官方消息:我們正在與甲骨文在美國開發額外的4.5吉瓦Stargate數據中心容量(總計超過5吉瓦!)。
我們位於德克薩斯州阿比林的Stargate I站點正在開始上線,以支持我們的下一代AI研究。
9.23K
我們在已經發布的 AI 模型上集中很多政策,但那些在內部等待的 AI 模型呢?我們的新論文探討了來自內部 AI 系統的風險。

Oscar Delaney7月21日 23:24
1/
最強大的人工智慧並不是公開的。幾個月來,實驗室在發布之前運行高度能力的內部模型。@ashwinkacharya 和我撰寫了一份新的 @IAPS 報告,標題為「管理內部人工智慧系統的風險」,探討了這帶來的隱藏危險。🧵
2.09K
Google Deepmind 和 OpenAI 都已達成 IMO 金獎。很高興能深入了解這一里程碑的細節。

Demis Hassabis7月22日 00:47
官方結果出爐 - Gemini 在國際數學奧林匹亞競賽中達到了金牌級別!🏆 一個進階版本能夠解決 6 道題目中的 5 道。令人難以置信的進步 - 祝賀 @lmthang 和團隊!
1.71K
Peter Wildeford (hiring!) 🇺🇸🚀 已轉發
我們可能正朝著 OpenAI 與 DeepMind IMO 之間的情節轉折前進。
剛看到 Joseph Myers 的一篇帖子(自 1992 年以來參與數學奧林匹克):IMO 委員會據報要求 AI 實驗室在閉幕式後的 7 天內不要公布結果——出於對人類參賽者的尊重(參見我昨天的帖子),並可能是為了給予適當驗證 AI 提交和格式的時間。
根據 Joseph 的說法,OpenAI 沒有與 IMO 合作測試他們的模型,91 位官方 IMO 協調員中也沒有參與評分其解答。與此同時,DeepMind 似乎遵循規則,耐心等待他們的輪到。
背景資訊:
IMO 有 6 道題目,每道題目值 7 分。今年的金牌截止分數是 35 分。即使是小的扣分也可能讓 OpenAI 降到銀牌。根據我對他們的寫作的理解,有些部分可能會引發問題——並可能扣分。
Terence Tao 也指出,雖然題目保持不變,但測試格式很重要。在標準條件下不會獲得銅牌的學生,可能在修改的設置下獲得金牌——這引發了關於 AI "解決 IMO" 的真正問題。
下週可能會變得火熱。敬請關注。


231.44K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可