1/ Cosa succederebbe se ti dicessi che potresti pre-addestrare LLM con una combinazione di GPU di livello consumer e GPU da datacenter, su internet a bassa larghezza di banda con perdite minime? Nuovo articolo: Pre-addestramento eterogeneo a bassa larghezza di banda di LLM