要確定 OpenAI 和 Google DeepMind 是否真的獲得了 IMO 金獎的 "公平競爭",實在是出乎意料的困難。期待更多的分析。
Jasper Dekoninck
Jasper Dekoninck7月22日 17:20
有趣的方法!然而,我們查看了證據和方法論,發現了一些問題,特別是在給模型的提示使用上。雖然支架確實提高了性能,但並未準確解決所有問題,也不會獲得金牌。🧵
1.33K