1/ E se eu lhe dissesse que poderia pré-treinar LLMs com uma mistura de GPUs de consumo e de datacenter, através de internet de baixa largura de banda com perda mínima? Novo artigo: Pré-Treinamento Heterogéneo de LLMs com Baixa Largura de Banda