素晴らしいベンチマーク。これを行う最初の AI は非常に印象的です 私は特に実験の要件が気に入っています。仮説を検証し、そこから学ぶまで、これらのどれも実際に解決することはできません
ARC Prize
ARC Prize7月19日 01:26
本日、人間にとって簡単と AI にとって難しいことの間の最も大きなギャップを持つ対話型推論ベンチマークである ARC-AGI-3 のプレビューを発表します リリースする内容: * 3つのゲーム(環境) * $10Kエージェントコンテスト * AIエージェントAPI 開始スコア - フロンティア AI: 0%、人間: 100%
5.48K