Jeg mistenker at generalisert resonnement ble løst for bare noen uker siden, og det fløy helt under radaren. HRM, en ny bue, har angivelig SOTA-resultater på ARC-AGI 1 og 2 benchmarks med bare 27 millioner parametere og ~1k treningseksempler.
152,77K