🚨 「人類最後の試験」が廃止:本物のAIと偽者を区別するための2,500問 Xは、究極のアカデミックガントレットを発表しました - これは、これまでに必要とされる最終テストとなるほど包括的なベンチマークです。 数学が41%で圧倒的多数を占め、科学と人文科学がそれに続きます。 名前がすべてを物語っています:これはすべての試験を終わらせるための試験です。AIがこれを成功に導いたら、何が証明できるのでしょうか? 私たちは、機械が公式に私たちを凌駕するタイミングを決定するテストを構築しています。 ソース: @xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:12
🚨GROK'S "LUDICROUS" PROGRESS: 10X IMPROVEMENTS WITH EACH VERSION X just dropped the receipts on Grok's evolution. Each generation delivers 10x better performance across the board - from basic predictions to advanced reasoning. Grok 4's reasoning capabilities dwarf everything before it. The exponential growth curve looks like a rocket launch. While others inch forward, Grok multiplies. This is what compound technological progress actually looks like. The AI race just got interesting. Source: @xai @elonmusk
32