Flott målestokk. Den første AI som gjør dette vil være veldig imponerende Jeg liker spesielt kravet om eksperimentering. Du kan egentlig ikke løse noen av disse før du tester hypoteser og lærer av dem
ARC Prize
ARC Prize19. juli, 01:26
I dag kunngjør vi en forhåndsvisning av ARC-AGI-3, Interactive Reasoning Benchmark med det største gapet mellom lett for mennesker og vanskelig for AI Vi lanserer: * 3 spill (miljøer) * $10K agentkonkurranse * API for AI-agenter Startscore - Frontier AI: 0%, Mennesker: 100%
5,48K