甚至不算铜牌:评估大型语言模型在2025年国际数学奥林匹克上的表现 🥉 来自MathArena团队的精彩博客文章: 评估大型语言模型在未受污染的数学竞赛中的表现 (),提供了对大型语言模型在国际数学奥林匹克(IMO)表现的独立分析。
580