銅メダルでさえない: 2025 年国際数学オリンピック🥉での LLM の評価 MathArena: Evaluating LLMs on Uncontaminated Math Competitions () の背後にあるチームからの素晴らしいブログ投稿は、IMO での LLM のパフォーマンスの独立した分析を提供します。
Deep Thinkを搭載したGeminiの上級版がIMOの6つの問題のうち5つを解き、合計35ポイントを獲得し、正式に金メダル級の性能を達成したようだ。 このモデルで遊ぶのが待ちきれません@lmthang❗️達成おめでとうございます
42.46K