イーロンマスクが再びそれをやってのけ、Grok 4でAI戦争を完全に粉砕したことは非常識です。 主な発表をまとめると、以下の通りです。 — トレーニング後の RL 支出 == トレーニング前の支出 — $3/M インプット told 、$15/M アウトプット tok、256k コンテキスト、128k を超える価格 2x — #1 on Humanity's Last Exam (一般的な難しい問題) 44.4%、#2 は 26.9% — GPQA(難しい大学院の問題)の#1 88.9%。#2は86.4% — AIME 2025 (数学) の #1 は 100%、#2 は 98.4% —ハーバードMIT数学の#1は96.7%、#2は82.5% —USAMO25(数学)の#1は61.9%、#2は49.4% — ARC-AGI-2 の #1 (人間には簡単、AI には難しい) 15.9%、#2 は 8.6% — LiveCodeBench(1月〜5月)の#1は79.4%、#2は75.8% Grok 4は、「すべての科目で博士号レベルよりも優れている可能性があり、例外はありません」..しかもかなり安いです。AI戦争の大舞台、そしてイーロンが登場。
13.48M