🚨GROK 在「人類的最後考試」中以 26.9% 的成績獲得成功,且沒有使用任何工具 這個擴展圖表講述了故事:更多的計算能力 = 更好的表現。 Grok 僅憑純粹的推理能力,擊潰了全球最艱難的學術基準的四分之一。 沒有計算器,沒有外部幫助。 只有原始的 AI 智力,解答了 2,500 道涉及人類知識各個領域的問題。 大多數人類即使有工具也會在這個測試中失敗。 Grok 是在蒙著眼睛的情況下完成的。 來源:@xai @elonmusk
Mario Nawfal
Mario Nawfal7月10日 12:14
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed. Math dominates at 41%, followed by sciences and humanities. The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove? We're building the test that determines when machines officially outsmart us. Source: @xai @elonmusk
89.57K