Сьогодні ми анонсуємо попередній перегляд ARC-AGI-3, еталону інтерактивного міркування з найширшим розривом між легким для людей і важким для штучного інтелекту Ми випускаємо: * 3 гри (середовища) * Конкурс агентів на $10 тис. * API AI агентів Початкові результати - Frontier AI: 0%, Люди: 100%
o3 (ліворуч) і Grok 4 (праворуч) повторюються нижче Спойлер: жоден з них не пройде жодного рівня
Ігри ARC-AGI-3 Preview потребують випробування тиском. Ми проводимо 30-денний конкурс агентів у партнерстві з @huggingface Ми закликаємо спільноту створювати агентів (і вигравати гроші!)
296,83K