Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Groß angelegte Deep Learning & Research @togethercompute
Learning@home/Hivemind-Autor (DMoE, DeDLOC, SWARM, Petals)
Promotion in dezentraler DL '2023
Wenn Sie auf der ICML sind und an verifizierbarer Inferenz interessiert sind, sollten Sie unbedingt an unserem Poster vorbeischauen!
Wir werden TOPLOC vorstellen, eine effiziente Aktivierungs-Hashing-Methode, die in verschiedenen Einstellungen funktioniert, z. B. beim Wechsel von Inferenz-Setups oder sogar Modellen.
16. Juli, 16:30 Uhr, E-1106
1,41K
Aus meiner Erfahrung kann es ziemlich schwierig sein, ein Paper über dezentrale DL bei hochkarätigen Konferenzen akzeptiert zu bekommen. Die Motivation ist vielen Gutachtern nicht vertraut, und die standardmäßigen Experimentiereinstellungen berücksichtigen nicht die Probleme, die Sie lösen möchten.
Daher bin ich sehr gespannt zu sehen, dass Unternehmen wie @PluralisHQ und @PrimeIntellect die Mühe investieren, ihre Ergebnisse zu teilen und sie auf großen Konferenzen zu veröffentlichen! Meiner Meinung nach zwingt Sie bereits die Vorbereitung der Einreichung dazu, rigoroser mit Ihren Experimenten umzugehen, und das Feedback von Gutachtern hilft Ihnen, die Botschaft des Papers zu schärfen.

Alexander Long14. Juli, 08:24
Für Menschen, die mit der Veröffentlichung von KI nicht vertraut sind, gibt es jedes Jahr 3 Hauptkonferenzen: ICML, ICLR und NeurIPS. Dies sind technische Konferenzen und das Äquivalent zu Fachzeitschriften in anderen Disziplinen - sie sind der Hauptveröffentlichungsort für KI. Der Wettbewerb, um auf diesen Konferenzen Papers zu haben, ist mittlerweile auf einem lächerlichen Niveau, es ist sehr schwierig, Papers akzeptiert zu bekommen, und es gibt viele Bedenken hinsichtlich des Überprüfungsprozesses, der zu diesem Zeitpunkt ziemlich laut ist. Ein starkes Paper ohne Mängel hat etwa eine 50%ige Chance, akzeptiert zu werden, und typischerweise wird ein Paper mehrere Male mit Änderungen der Gutachter eingereicht, bis es akzeptiert wird. Trotz alledem bleiben Papers in diesen Veranstaltungsorten der primäre Stempel der Legitimität in der KI-Welt und sind wahrscheinlich immer noch die primären Karrieremetriken für ML-Forscher (obwohl dies meiner Meinung nach schwächer wird, da so viel der Forschung in den Grenzlabors unveröffentlicht ist).
Haupttrack-Papers unterscheiden sich erheblich von Workshop-Papers. Der Haupttrack hat eine intensive, ernsthafte Peer-Review. Workshop-Papers sind für vorläufige Arbeiten, die einen Hinweis auf ein interessantes Ergebnis geben, aber entweder nicht vollständig sind oder das Ergebnis nicht signifikant genug für den Haupttrack ist. Sie müssen nur von dem Gutachterpool des Workshops überprüft werden und erscheinen nicht in den Proceedings.
Viele großartige Papers sind zuerst in Workshops erschienen (z.B. Grokking) - aber Workshop- und Haupttrack-Papers sind grundlegend unterschiedliche Dinge, mit einem grundlegend unterschiedlichen Einflussniveau. Die einzigen beiden Unternehmen im dezentralen KI-Bereich, die in diesem Jahr Haupttrack-Papers haben, sind @PrimeIntellect und Pluralis.
7,25K
Vielen Dank an Ferdinand für die Moderation dieses Gesprächs! Es war eine großartige Gelegenheit, alle Teile von SWARM zu überblicken und die Motivation dahinter eingehend zu diskutieren.
Ich hoffe, dieses Video wird dezentrale DL zugänglicher machen: Viele Ideen in diesem Bereich sind einfacher, als sie erscheinen!

Ferdinand Mom12. Juni 2025
Die Videoüberprüfung des Forschungspapiers über "Swarm Parallelism" zusammen mit dem Autor @m_ryabinin, Distinguished Research Scientist @togethercompute, ist jetzt verfügbar! Link unten 👇
Zum Kontext: Die meisten dezentralen Trainingsansätze folgen heute DDP-Stil-Methoden, die eine vollständige Modellreplikation auf jedem Knoten erfordern. Während dies für diejenigen, die über H100-Cluster verfügen, praktisch ist, bleibt es für die überwiegende Mehrheit der potenziellen Mitwirkenden unerreichbar, hier kommt SWARM ins Spiel!

3,1K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten