¡Muchas gracias a Ferdinand por organizar esta conversación! Fue una gran oportunidad para ver todas las partes de SWARM y discutir en profundidad la motivación detrás de ellas. Espero que este video haga que la enseñanza a distancia descentralizada sea más accesible: ¡muchas ideas en el campo son más simples de lo que parecen!
Ferdinand Mom
Ferdinand Mom12 jun 2025
La revisión en video del trabajo de investigación sobre "Paralelismo de enjambre" junto con el autor @m_ryabinin, Distinguido Científico Investigador @togethercompute ya está disponible. Enlace a continuación 👇 Para contextualizar, la mayoría de la capacitación descentralizada actual sigue enfoques de estilo DDP que requieren la replicación completa del modelo en cada nodo. Si bien es práctico para aquellos con clústeres H100 a su disposición, esto sigue estando fuera del alcance de la gran mayoría de los contribuyentes potenciales, ¡aquí es donde SWARM resulta útil!
3.05K