1/ ¿Qué pasaría si te dijera que podrías pre-entrenar LLMs con una mezcla de GPUs de consumo y de datacenter, a través de internet de baja capacidad con una pérdida mínima? Nuevo artículo: Pre-entrenamiento Heterogéneo de LLMs en Baja Capacidad