2025 年国際数学オリンピックで、最新の実験的推論 LLM による金メダルレベルの成績を収めました。 モデルは、人間と同じルール(例:セッションあたり4.5時間、ツールなし)の下で自然言語で動作(つまり、自然言語証明を出力します)。 素晴らしいマイルストーン!
Alexander Wei
Alexander Wei7月19日 15:50
1/N 最新の@OpenAI実験的推論 LLM が、世界で最も権威のある数学コンテストである国際数学オリンピック (IMO) で金メダルレベルの成績という、AI における長年の壮大な課題を達成したことを共有できることを嬉しく思います。
最も注目すべきは、このシステムが強化学習とテスト時間計算のスケーリングを使用する非常に一般的なアプローチを使用していることです。
Alexander Wei
Alexander Wei7月19日 15:50
5/N 結果自体に加えて、私は私たちのアプローチに興奮しています:私たちは、狭いタスク固有の方法論ではなく、汎用強化学習とテスト時のコンピューティングスケーリングの新境地を開拓することによって、この能力レベルに到達します。
116.8K