Skvělý benchmark. První umělá inteligence, která to dokáže, bude velmi působivá Obzvláště se mi líbí požadavek na experimentování. Žádný z nich nemůžete skutečně vyřešit, dokud neotestujete hypotézy a nepoučíte se z nich
ARC Prize
ARC Prize19. 7. 01:26
Dnes oznamujeme náhled ARC-AGI-3, benchmarku interaktivního uvažování s nejširším rozdílem mezi snadným pro člověka a obtížným pro umělou inteligenci Vydáváme: * 3 hry (prostředí) * Soutěž agentů v hodnotě 10 000 $ * API agentů AI Startovní skóre - Frontier AI: 0%, Lidé: 100%
5,48K