een werklast draaien op torchtitan met de standaardconfiguratie, 23% mfu, de configuratie een beetje aanpassen, compileren en flex inschakelen, batchgrootte een beetje verhogen --> 58% mfu. Ik wou dat we een betere standaard hadden in het torch-ecosysteem.
14K