コードベースがGPUレベルでバッチサイズを定義するポイントがわかりません。これは、スケーリングをアップ/ダウンする実験時にバッチサイズパラメータを手動で変更する必要があることを意味します。 私は歴史的にgrad accがないコードベースで行われたと思いますか?
1.58K