Sospecho que el razonamiento generalizado se resolvió hace solo unas semanas y pasó completamente desapercibido. HRM, una nueva arquitectura, supuestamente tiene resultados SOTA en los benchmarks ARC-AGI 1 y 2 con solo 27 millones de parámetros y ~1k ejemplos de entrenamiento.
164,06K