有趣的是:3到4个月前,我为一些学术研究运行了o3,解决了一系列AIME风格的问题。他们花了这么长时间才写出结果总结(98%),而在此期间,Alex已经解决了proof+IMO,哈哈。
103