熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
闡明 o3 的ARC-AGI性能
OpenAI 已確認:
* 發佈的 o3 與我們在 2024 年 12 月測試的型號不同
* 所有已發佈的 o3 計算層都小於我們測試的版本
* 發佈的 o3 沒有使用 ARC-AGI 數據進行訓練,甚至沒有訓練集
* 發佈的 o3 針對聊天/產品使用進行了優化,它引入了 ARC-AGI 的優點和缺點
ARC Prize 將做什麼:
* 我們將重新測試已發佈的 o3(所有計算層)併發佈更新的結果。之前的分數將被標記為“預覽”
* 我們將儘快測試和發佈 o4-mini 結果
* 我們將在 o3-pro 上市後進行測試
127.35K
熱門
排行
收藏