Automaattinen tutkimus näytteen tehokkuudesta! Otin @karpathy:n automaattisen tutkimuksen ja muutin tavoitteen minimoimaan validointitappiot kiinteälle token-budjetille, joka on 10 miljoonaa tokenia. Ajetin sen yön yli ja järjestelmä löysi muutoksia, jotka johtivat 14 % parannukseen verrattuna perusarvoon. Niin hullua!
Mikä toimi ja mikä ei.
157