世界で最も難しい高校数学試験、6 問題 9 時間 IMO 2025 が今週でした。 AIモデルのパフォーマンスは低かった。 Gemini 2.5 Pro は、ベスト オブ 32 評価で、わずか 13/42 で 431.97 ドルという最高スコアを獲得しました。銅メダルのカットオフは19でした。 AIが難しい数学を解くには長い道のりがあります。
MathArena でのモデルのパフォーマンスをより美しく視覚化したものです
P6 は間違いなく最も難しく、最も興味深い問題でした。ほとんどの人はそれを理解できますが、それを解決できる人はほとんどいません。 すべてのモデルのスコアは0/7でした。
小さな修正:
Alexander Wei
Alexander Wei12時間前
1/N 最新の@OpenAI実験的推論 LLM が、世界で最も権威のある数学コンテストである国際数学オリンピック (IMO) で金メダルレベルの成績という、AI における長年の壮大な課題を達成したことを共有できることを嬉しく思います。
76.35K