Ótimo benchmark. A primeira IA a fazer isso será muito impressionante Eu particularmente gosto da exigência de experimentação. Você não pode realmente resolver nenhum deles até testar hipóteses e aprender com elas
ARC Prize
ARC Prize19 de jul., 01:26
Hoje, estamos anunciando uma prévia do ARC-AGI-3, o Benchmark de Raciocínio Interativo com a maior lacuna entre fácil para humanos e difícil para IA Estamos lançando: * 3 jogos (ambientes) * Concurso de agente de $ 10K * API de agentes de IA Pontuação inicial - Frontier AI: 0%, Humanos: 100%
5,67K