有趣的方法!然而,我们查看了证明和方法论,发现了一些问题,特别是在给模型提供提示的使用上。虽然支架确实提高了性能,但并没有准确解决所有问题,也不会获得金牌。🧵
Lin Yang
Lin Yang7月22日 09:18
🚨 奥林匹克数学 + AI: 我们在新的 IMO 2025 问题上运行了谷歌的 Gemini 2.5 Pro。通过仔细的提示和流程设计,它解决了 6 个问题中的 5 个——对于需要深刻洞察和创造力的任务来说,这非常了不起。 这个模型有可能赢得金牌! 🥇 #AI #数学 #LLMs #IMO2025
22.64K