Отличный ориентир. Первый ИИ, который это сделает, будет очень впечатляющим Мне особенно нравится требование к экспериментам. Вы не сможете решить ни одну из этих задач, пока не протестируете гипотезы и не извлечете из них уроки.
ARC Prize
ARC Prize19 июл., 01:26
Today, we're announcing a preview of ARC-AGI-3, the Interactive Reasoning Benchmark with the widest gap between easy for humans and hard for AI We’re releasing: * 3 games (environments) * $10K agent contest * AI agents API Starting scores - Frontier AI: 0%, Humans: 100%
5,73K