Suspeito que o raciocínio generalizado foi resolvido há apenas algumas semanas e passou completamente despercebido. HRM, uma nova arquitetura, supostamente tem resultados SOTA nos benchmarks ARC-AGI 1 e 2 com apenas 27 milhões de parâmetros e ~1k exemplos de treino.
152,78K