我们最新的实验性推理 LLM 在 2025 年国际数学奥林匹克中表现出金牌级别的成绩。 模型在自然语言下操作(即输出自然语言证明),遵循与人类相同的规则(例如,每次会议 4.5 小时,不使用工具)。 令人惊叹的里程碑!
Alexander Wei
Alexander Wei7月19日 15:50
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。
最引人注目的是,这个系统采用了一种非常通用的方法,使用强化学习和测试时间计算的扩展:
Alexander Wei
Alexander Wei7月19日 15:50
除了结果本身,我对我们的方法感到兴奋:我们不是通过狭窄的、特定任务的方法达到这个能力水平,而是通过在通用强化学习和测试时计算扩展方面开辟新天地。
116.82K