熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

AshutoshShrivastava
發佈有關最新 AI 新聞、工具、教程和模因的資訊。
Sapient 發布了他們的層次推理模型 (HRM),結果相當有趣。這是一個擁有 2700 萬個參數的模型,在推理基準測試如 ARC-AGI-2、複雜的數獨謎題和大型迷宮的路徑尋找上超越了 Claude 3.5 和 o3-mini。
這一點值得注意:
效率方面令人驚訝。HRM 在大約 1000 個範例上進行訓練,沒有預訓練或思維鏈提示,但它能處理通常需要更大模型的複雜推理任務。這使得它在邊緣設備上的部署變得實用,並且對於沒有龐大計算預算的團隊來說也變得可及。
這種受大腦啟發的架構不僅僅是術語。HRM 採用雙系統設計,擁有兩個模塊:一個用於高層次的抽象規劃,另一個用於快速的詳細執行,運作於不同的時間尺度。這反映了人類認知的運作方式,結合了快速的直覺處理和較慢的深思熟慮推理。
低資源需求改變了可及性方程式。雖然大多數先進的 AI 需要大量基礎設施,但 HRM 可以在普通硬體上運行,為無法負擔大規模計算的初創公司和研究人員開啟了複雜推理能力。
技術方法:
HRM 不像變壓器那樣按順序處理標記,而是使用在連續空間中運作的層次遞歸循環,而不是離散標記。該模型直接解決任務,而不需要通過明確的逐步鏈來口頭化其思考過程。
參數效率來自於學習從最小範例中概括的推理模式,而不是記憶大量的訓練數據。訓練使用單步梯度近似來保持內存使用量恆定,使其在標準硬體上變得實用。
HRM 還會調整其計算 - 在更難的問題上花費更多的循環,而在較簡單的問題上花費較少,使用強化學習來決定何時停止推理。推理過程是可解釋的,特別是在視覺任務上,您可以觀察它如何逐步解決問題。
這表明,先進的推理可能更多地關乎架構設計而非規模,這可能會改變我們對構建有能力的 AI 系統的思考方式。

3.8K
Google DeepMind 推出了新的 AlphaEarth Foundations 模型。

Google DeepMind2025年7月30日
我們的新人工智慧模型 AlphaEarth Foundations 正在以驚人的細節繪製地球地圖。🌏🔍
科學家們現在將能夠追蹤森林砍伐的影響,監測作物健康等,這得益於我們的新數據集,速度顯著加快。🧵
4.14K
"gpt-5-auto", "gpt-5-reasoning"
在 macos 應用程式的模型列表中被發現。
你認為 OpenAI 什麼時候會推出 GPT-5 ??


Nick D2025年7月30日
在 macos 應用程式的模型列表中找到 gpt-5。
"gpt-5-auto", "gpt-5-reasoning"
在:
`~/Library/Caches/com.openai.chat/fsCachedData` 以便您可以驗證
@btibor91 @apples_jimmy

765
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可