Executando alguma carga de trabalho no torchtitan com configuração padrão, 23% mfu, altere um pouco a configuração, habilite compilar e flexionar, aumente um pouco o tamanho do lote --> 58% mfu. Eu gostaria que tivéssemos mais desempenho padrão no ecossistema da tocha
13,98K