Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Широкомасштабное глубокое обучение и исследовательские @togethercompute
Learning@home/автор Hivemind (DMoE, DeDLOC, SWARM, Petals)
Кандидат наук в области децентрализованного DL '2023
Согласно моему опыту, получить публикацию по децентрализованному DL на конференциях высокого уровня может быть довольно сложно. Мотивация не знакома многим рецензентам, а стандартные условия эксперимента не учитывают проблемы, которые вы стремитесь решить.
Поэтому я очень рад видеть компании, такие как @PluralisHQ и @PrimeIntellect, которые прилагают усилия, чтобы поделиться своими результатами и опубликовать их на крупных конференциях! На мой взгляд, даже подготовка к подаче заставляет вас быть более строгими в отношении ваших экспериментов, а внешняя обратная связь от рецензентов помогает вам уточнить сообщение статьи.

Alexander Long14 июл., 08:24
Для людей, не знакомых с публикацией в области ИИ, существует 3 основных конференции каждый год: ICML, ICLR и NeurIPS. Это технические конференции и эквивалент журналов в других дисциплинах - они являются основным местом публикации для ИИ. Конкуренция за публикацию статей на этих конференциях сейчас достигла абсурдного уровня, получить одобрение статей очень сложно, и существует много беспокойства по поводу процесса рецензирования, который в данный момент довольно шумный. Сильная статья без недостатков имеет около 50% шансов на принятие, и обычно статья подается с изменениями рецензентов несколько раз, прежде чем ее примут. Несмотря на все это, статьи на этих площадках остаются основным знаком легитимности в мире ИИ и, вероятно, все еще являются основными карьерными метриками для исследователей в области машинного обучения (хотя, на мой взгляд, это ослабевает, так как большая часть исследований в передовых лабораториях не публикуется).
Статьи основного трека значительно отличаются от статей семинаров. Основной трек имеет интенсивное, серьезное рецензирование. Статьи семинаров предназначены для предварительных работ, которые дают некоторое представление об интересном результате, но либо не завершены, либо результат недостаточно значителен для основного трека. Они должны быть рецензированы только пулом рецензентов семинара и не появляются в материалах конференции.
Многие отличные статьи впервые появились на семинарах (например, grokking) - но статьи семинаров и основного трека являются принципиально разными вещами с принципиально разным уровнем влияния. Единственные две компании в области децентрализованного ИИ, которые имеют статьи основного трека в этом году, это @PrimeIntellect и Pluralis.
7,19K
Большое спасибо Фердинанду за организацию этого разговора! Это была отличная возможность рассмотреть все части SWARM и обсудить мотивацию, стоящую за ними, более подробно.
Надеюсь, это видео сделает децентрализованный DL более доступным: многие идеи в этой области проще, чем кажутся!

Ferdinand Mom12 июн. 2025 г.
Видеорецензия научной работы на тему "Параллелизм роя" с автором @m_ryabinin, выдающимся научным сотрудником @togethercompute, теперь доступна! Ссылка ниже 👇
Для контекста, большинство децентрализованных обучений сегодня следуют подходам в стиле DDP, требующим полной репликации модели на каждом узле. Хотя это практично для тех, у кого есть кластеры H100, это остается недоступным для подавляющего большинства потенциальных участников, здесь на помощь приходит SWARM!

3,04K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные