熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
🚨GROK 在「人類的最後考試」中以 26.9% 的成績獲得成功,且沒有使用任何工具
這個擴展圖表講述了故事:更多的計算能力 = 更好的表現。
Grok 僅憑純粹的推理能力,擊潰了全球最艱難的學術基準的四分之一。
沒有計算器,沒有外部幫助。
只有原始的 AI 智力,解答了 2,500 道涉及人類知識各個領域的問題。
大多數人類即使有工具也會在這個測試中失敗。
Grok 是在蒙著眼睛的情況下完成的。
來源:@xai @elonmusk


7月10日 12:14
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS
X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed.
Math dominates at 41%, followed by sciences and humanities.
The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove?
We're building the test that determines when machines officially outsmart us.
Source: @xai @elonmusk

89.57K
熱門
排行
收藏