熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
很好的基準。第一個做到這一點的AI將會非常令人印象深刻
我特別喜歡對實驗的要求。你無法真正解決這些問題,直到你測試假設並從中學習

7月19日 01:26
今天,我們宣布 ARC-AGI-3 的預覽,這是互動推理基準,具有人類容易和 AI 難度之間最大的差距。
我們將發布:
* 3 款遊戲(環境)
* 10,000 美元的代理比賽
* AI 代理 API
起始分數 - 前沿 AI:0%,人類:100%

5.65K
熱門
排行
收藏