祝贺GDM团队在IMO结果上的成功!我认为他们的平行成功突显了人工智能进步的速度。他们的方法与我们有些不同,但我认为这表明还有许多研究方向可以进一步推进。关于我们的模型和结果的一些想法 🧵
大约2个月前,IMO给我们发了电子邮件,邀请我们参加IMO的正式(Lean)版本。我们一直专注于自然语言中的一般推理,而没有Lean的限制,因此我们拒绝了。我们从未被询问过关于自然语言数学选项的事宜。
在过去几个月中,我们在一般推理方面取得了很大进展。这涉及到收集、整理和训练高质量的数学数据,这些数据也将用于未来的模型。在我们的IMO评估中,我们没有使用RAG或任何工具。
在我们分享结果之前,我们与一位IMO董事会成员进行了交谈,他要求我们在颁奖典礼结束后再公开这一消息,我们欣然遵从了这一请求。
我们在太平洋时间凌晨1点(澳大利亚东部标准时间下午6点)宣布了这一消息,颁奖典礼结束后。没有人要求我们在那之后再宣布。
最重要的是,我们很高兴能与世界分享我们的进展和成果。人工智能的推理能力正在快速发展,这些IMO结果确实显示了这一点。
252.48K