Autoresearch per l'Efficienza del Campione! Ho preso l'autoresearch di @karpathy e ho cambiato l'obiettivo per minimizzare la perdita di validazione per un budget fisso di 10 milioni di token. L'ho eseguito durante la notte e il sistema ha scoperto modifiche che hanno portato a un miglioramento del 14% rispetto alla baseline. Incredibile!
Cosa ha funzionato e cosa non ha funzionato.
129