看到模型解决这些国际数学奥林匹克问题并取得金牌级表现,真是太神奇了。几点想法 🧵
Alexander Wei
Alexander Wei21 小时前
1/N 我很高兴地分享,我们最新的 @OpenAI 实验性推理 LLM 在人工智能领域实现了一个长期以来的重大挑战:在世界上最负盛名的数学竞赛——国际数学奥林匹克(IMO)中达到了金牌级别的表现。
该模型在没有像 lean 或编码这样的工具的情况下解决这些问题,它仅使用自然语言,并且只有 4.5 小时。我们看到模型在非常高的层次上进行推理——尝试不同的策略,从示例中进行观察,并测试假设。
我们从 AIME (GPT 4o) 的 12% 到大约 15 个月后的 IMO 金牌,这真是太疯狂了。我们走得非常快,非常远。我不会感到惊讶,如果到明年,模型将能够推导出新的定理并为原创数学研究做出贡献!
394.92K