这个结果最显著的地方在于,这个未命名的实验推理模型在完全不使用任何工具的情况下达到了这个分数——看起来它只是另一个经典的下一个标记预测LLM,上面叠加了一堆强化学习。
Alexander Wei
Alexander Wei7月19日 15:50
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。
@brandonwilson @Yossi_Dahan_ 强烈不同意这一点,部分原因在这里说明。
Simon Willison
Simon Willison7月18日 04:08
我完全不担心这些工具会使我作为软件工程师的技能过时。
40.95K