加速感が伝わってきますか?
Noam Brown
Noam Brown7月19日 15:52
特に数学において、AI の進歩がどれほど速かったかを振り返る価値があります。2024年、AIラボはモデルリリースの評価として小学校の数学(GSM8K)を使用していました。それ以来、私たちは(高校の)MATHベンチマークを飽和させ、次にAIMEを飽和させ、そして今ではIMOゴールドを獲得しています。
8.43K