很好的基準。第一個做到這一點的AI將會非常令人印象深刻 我特別喜歡對實驗的要求。你無法真正解決這些問題,直到你測試假設並從中學習
ARC Prize
ARC Prize7月19日 01:26
今天,我們宣布 ARC-AGI-3 的預覽,這是互動推理基準,具有人類容易和 AI 難度之間最大的差距。 我們將發布: * 3 款遊戲(環境) * 10,000 美元的代理比賽 * AI 代理 API 起始分數 - 前沿 AI:0%,人類:100%
5.65K