Autoresearch für Stichproben-Effizienz! Ich habe @karpathy's Autoresearch genommen und das Ziel geändert, um den Validierungsverlust bei einem festen Token-Budget von 10 Millionen Tokens zu minimieren. Habe es über Nacht laufen lassen und das System hat Anpassungen entdeckt, die zu einer Verbesserung von 14 % gegenüber der Basislinie führten. So verrückt!
Was funktioniert hat und was nicht.
142