Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Nghiên cứu và học sâu quy mô lớn @togethercompute
Tác giả Learning@home / Hivemind (DMoE, DeDLOC, SWARM, Petals)
Tiến sĩ DL phi tập trung '2023
Nếu bạn đang ở ICML và quan tâm đến suy diễn có thể xác minh, hãy chắc chắn ghé qua poster của chúng tôi!
Chúng tôi sẽ trình bày TOPLOC, một phương pháp băm kích hoạt hiệu quả hoạt động trong nhiều cài đặt khác nhau, ví dụ như chuyển đổi các thiết lập suy diễn hoặc thậm chí là các mô hình.
Ngày 16 tháng 7, 4:30 chiều, E-1106
1,43K
Theo kinh nghiệm của tôi, việc có một bài báo về DL phi tập trung được chấp nhận tại các hội nghị hàng đầu có thể khá khó khăn. Động lực không quen thuộc với nhiều người đánh giá, và các thiết lập thí nghiệm tiêu chuẩn không tính đến những vấn đề mà bạn muốn giải quyết.
Vì vậy, tôi rất hào hứng khi thấy những công ty như @PluralisHQ và @PrimeIntellect đang nỗ lực chia sẻ kết quả của họ và công bố chúng tại các hội nghị lớn! Theo ý kiến của tôi, ngay cả việc chuẩn bị nộp bài cũng buộc bạn phải nghiêm túc hơn về các thí nghiệm của mình + phản hồi từ các nhà đánh giá giúp bạn làm sắc nét thông điệp của bài báo.

Alexander Long08:24 14 thg 7
For people not familiar with AI publishing; there are 3 main conferences every year. ICML, ICLR and NeurIPS. These are technical conferences and the equivalent of journals in other disciplines - they are the main publishing venue for AI. The competition to have papers at these conferences is now at a ridiculous level, getting papers accepted is very hard, and there is a lot of concern about the review process which is quite noisey at this point. A strong paper with no flaws has around a 50% chance of being accepted, and typically a paper is submitted with reviewer changes several times until it is accepted. Despite all that, papers in these venues remain the primary stamp of legitimacy in AI world, and are probably still the primary career metrics for ML researchers (although this is weakening imo as so much of the research in the frontier labs is unpublished).
Main Track papers are significantly different to workshop papers. The main track has intense, serious peer review. Workshop papers are for preliminary work, that give some indication of an interesting result, but are either not complete or the result is not significant enough for main track. They are only required to be reviewed by the workshop reviewer pool and they don’t appear in proceedings.
Many great papers have first shown up in workshops (e.g. grokking) - but workshop and main track papers are fundamentally different things, with a fundamentally different level of impact. The only two companies in decentralised AI that have main track papers this year are @PrimeIntellect and Pluralis.
7,27K
Max Ryabinin đã đăng lại
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 Đào tạo phân tán trong Machine Learning🌍
Tham gia với chúng tôi vào ngày 12 tháng 7 khi @Ar_Douillard khám phá các phương pháp chính như FSDP, Pipeline & Expert Parallelism, cùng với các phương pháp tiếp cận mới nổi như DiLoCo và SWARM — đẩy giới hạn của đào tạo phân tán, toàn cầu.
Tìm hiểu thêm:

7,27K
Cảm ơn rất nhiều Ferdinand đã tổ chức cuộc trò chuyện này! Đây là một cơ hội tuyệt vời để tổng quan tất cả các phần của SWARM và thảo luận sâu về động lực đứng sau chúng.
Tôi hy vọng video này sẽ giúp việc học tập phi tập trung trở nên dễ tiếp cận hơn: nhiều ý tưởng trong lĩnh vực này đơn giản hơn những gì chúng ta nghĩ!

Ferdinand Mom12 thg 6, 2025
Video đánh giá bài nghiên cứu về "Swarm Parallelism" cùng với tác giả @m_ryabinin, Nhà khoa học nghiên cứu xuất sắc @togethercompute hiện đã có ! Liên kết bên dưới 👇
Để có bối cảnh, hầu hết các phương pháp đào tạo phi tập trung hiện nay đều theo các phương pháp kiểu DDP yêu cầu sao chép toàn bộ mô hình trên mỗi nút. Mặc dù thực tiễn cho những người có cụm H100 trong tay, nhưng điều này vẫn nằm ngoài tầm với của phần lớn các nhà đóng góp tiềm năng, đây là lúc SWARM trở nên hữu ích!

3,12K
Hàng đầu
Thứ hạng
Yêu thích
Onchain thịnh hành
Thịnh hành trên X
Ví funding hàng đầu gần đây
Được chú ý nhất