ちょうど2日前まで人類は安全だと思っていたが、文字通り日数で数えている... 背景: AI が国際数学オリンピック (IMO) でメダルを獲得したのはこれが初めてではありません。昨年、Google の AlphaProof が銀賞を獲得しましたが、そのモデルは数学専用にトレーニングされました。 今回、OpenAIは汎用モデル(おそらく内部GPT-5プロトタイプ?)を使用し、金賞を獲得しました。これは、重要な意味において大きな飛躍です。 これを大局的に考えると、IMOレベルの問題を解決するには、通常、エリートの人間の競争相手が約100分かかります。ほんの 2 年前、トップ AI モデルは、人間が解くのに約 10 秒かかる小学校の文章題 (GSM8k) にまだ苦労していました。 OpenAI の Dan Roberts 氏が Sequoia の AI Ascent 2025 で共有したように、AI が処理できるタスクの長さは 7 か月ごとに 2 倍になっています。2025 年後半までに、GPT-5 は人間のタスク 1 時間のレベルで動作するようになる可能性が非常に高いです。 1つの注意点:今年のIMOは難易度バランスに欠陥があり、問題1〜5は比較的簡単だったのに対し、問題6は異常に難しかったと伝えられています。その結果、多くのスコアが28〜35の間にクラスター化されました(各問題は7ポイントの価値があります)。AIは35点を獲得し、金メダルに十分だった。少し運が良かったが、軌跡は否定できない。 最後になりましたが、数学コンテストは間違いなく、中国の中国人、米国の中国人、そしてAIモデル(米国と中国の中国人によって構築された)の間の競争になるでしょう
Alexander Wei
Alexander Wei7月19日 15:50
1/N 最新の@OpenAI実験的推論 LLM が、世界で最も権威のある数学コンテストである国際数学オリンピック (IMO) で金メダルレベルの成績という、AI における長年の壮大な課題を達成したことを共有できることを嬉しく思います。
5.42K