Ich führe einige Arbeitslasten auf torchtitan mit der Standardkonfiguration aus, 23% mfu, ändere ein wenig die Konfiguration, aktiviere Kompilierung und Flexibilität, erhöhe die Batch-Größe ein wenig --> 58% mfu. Ich wünschte, wir hätten eine leistungsfähigere Standardkonfiguration im Torch-Ökosystem.
14K