Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Învățare profundă și cercetare la scară largă @togethercompute
Autor Learning@home/Hive Mind (DMoE, DeDLOC, SWARM, Petals)
Doctorat în DL descentralizat '2023
Dacă sunteți la ICML și sunteți interesat de inferențe verificabile, asigurați-vă că treceți pe la posterul nostru!
Vom prezenta TOPLOC, o metodă eficientă de hashing de activare care funcționează într-o varietate de setări, de exemplu, comutarea configurațiilor de inferență sau chiar a modelelor.
16 iulie, 4:30pm, E-1106
1,45K
Din experiența mea, acceptarea unei lucrări despre DL descentralizat la conferințe de nivel superior poate fi destul de dificilă. Motivația nu este familiară pentru mulți recenzenți, iar setările standard ale experimentului nu țin cont de problemele pe care doriți să le rezolvați.
Prin urmare, sunt foarte încântat să văd companii ca @PluralisHQ și @PrimeIntellect investind efortul de a-și împărtăși rezultatele și de a le publica la conferințe majore! În opinia mea, chiar și pregătirea trimiterii vă obligă să fiți mai riguros în ceea ce privește experimentele + feedback-ul extern de la recenzori vă ajută să ascuțiți mesajul lucrării.

Alexander Long14 iul., 08:24
Pentru persoanele care nu sunt familiarizate cu publicarea AI; Există 3 conferințe principale în fiecare an. ICML, ICLR și NeurIPS. Acestea sunt conferințe tehnice și echivalentul revistelor din alte discipline - sunt principalul loc de publicare pentru AI. Competiția pentru a avea lucrări la aceste conferințe este acum la un nivel ridicol, obținerea lucrărilor acceptate este foarte dificilă și există multă îngrijorare cu privire la procesul de revizuire, care este destul de zgomotos în acest moment. O lucrare puternică, fără defecte, are aproximativ 50% șanse de a fi acceptată și, de obicei, o lucrare este trimisă cu modificări de recenzor de mai multe ori până când este acceptată. În ciuda tuturor acestor lucruri, lucrările din aceste locuri rămân principala ștampilă de legitimitate în lumea AI și sunt probabil încă principala măsură de carieră pentru cercetătorii ML (deși acest lucru slăbește în opinia mea, deoarece o mare parte din cercetarea din laboratoarele de frontieră este nepublicată).
Lucrările Main Track sunt semnificativ diferite de lucrările de atelier. Piesa principală are o evaluare intensă și serioasă. Lucrările de atelier sunt pentru lucrări preliminare, care dau unele indicii ale unui rezultat interesant, dar fie nu sunt complete, fie rezultatul nu este suficient de semnificativ pentru pista principală. Acestea trebuie doar să fie revizuite de grupul de recenzenți ai atelierului și nu apar în proceduri.
Multe lucrări grozave au apărut pentru prima dată în ateliere (de exemplu, grokking) - dar lucrările de atelier și cele principale sunt lucruri fundamental diferite, cu un nivel fundamental diferit de impact. Singurele două companii din AI descentralizată care au documente principale în acest an sunt @PrimeIntellect și Pluralis.
7,3K
Max Ryabinin a repostat
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 Instruire distribuită în învățarea🌍 automată
Alăturați-vă nouă pe 12 iulie, în timp ce @Ar_Douillard explorează metode cheie precum FSDP, Pipeline și Expert Parallelism, plus abordări emergente precum DiLoCo și SWARM – împingând limitele formării globale și distribuite.
Află mai multe:

7,27K
Îi mulțumesc mult lui Ferdinand pentru găzduirea acestei conversații! A fost o oportunitate grozavă de a trece în revistă toate părțile SWARM și de a discuta în profunzime motivația din spatele lor.
Sper că acest videoclip va face DL-ul descentralizat mai accesibil: multe idei din domeniu sunt mai simple decât par!

Ferdinand Mom12 iun. 2025
Recenzia video a lucrării de cercetare despre "Paralelismul roiului" împreună cu autorul @m_ryabinin, Distinguished Research Scientist @togethercompute este acum publicată! Link mai jos 👇
Pentru context, majoritatea instruirii descentralizate de astăzi urmează abordări în stil DDP care necesită replicarea completă a modelului pe fiecare nod. Deși practic pentru cei care au clustere H100 la dispoziție, acest lucru rămâne la îndemâna marii majorități a potențialilor contribuitori, aici SWARM este util!

3,14K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante