闡明 o3 的ARC-AGI性能 OpenAI 已確認: * 發佈的 o3 與我們在 2024 年 12 月測試的型號不同 * 所有已發佈的 o3 計算層都小於我們測試的版本 * 發佈的 o3 沒有使用 ARC-AGI 數據進行訓練,甚至沒有訓練集 * 發佈的 o3 針對聊天/產品使用進行了優化,它引入了 ARC-AGI 的優點和缺點 ARC Prize 將做什麼: * 我們將重新測試已發佈的 o3(所有計算層)併發佈更新的結果。之前的分數將被標記為“預覽” * 我們將儘快測試和發佈 o4-mini 結果 * 我們將在 o3-pro 上市後進行測試
127.35K