一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

o3 Pro on ARC-AGI Semi Private 评估结果 ARC-AGI-1 的： * 低：44%，1.64 USD/任务 * 中等：57%，3.18 美元/任务 * 高：59%，4.16 USD/任务 ARC-AGI-2 的： * 所有推理努力：<5%，4-7 美元/任务要点： * O3-Pro 与 O3 性能一致 * o3 的新价格设定了 ARC-AGI-1 Frontier

请注意，o3 Pro *不是*我们在2024年12月测试的同一型号（o3-preview） OpenAI已明确确认这一点。有关更多信息，请参见参考推文。

o3的结果已更新，以反映价格降低80%的情况

图表中新增了 o3（高推理）和 o4-mini（高推理）的数据点。它们之前因模型超时而被排除。 OpenAI 的新“后台模式”使我们能够在高计算设置下处理这些模型。

查看排行榜：重现结果：

108.71K