Autoresearch for prøveeffektivitet! Jeg tok @karpathy sin autoresearch og endret målet til å minimere valideringstap for et fast tokenbudsjett på 10 millioner tokens. Kjørte det over natten, og systemet oppdaget justeringer som ga 14 % forbedring over utgangspunktet. Så sprøtt!
Hva som fungerte og hva som ikke gjorde det.
163