Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alexander Long
Основатель @PluralisHQ | ML PhD
Обучение протоколам: многосторонняя параллельная модель с низкой пропускной способностью
Ноам, как правило, не склонен к преувеличениям.

Noam Brown19 июл., 15:52
Куда это идет? Насколько быстро развивался ИИ в последнее время, я полностью ожидаю, что эта тенденция продолжится. Важно отметить, что я думаю, мы близки к тому, чтобы ИИ существенно способствовал научным открытиям. Существует большая разница между ИИ, который немного ниже топового человеческого уровня, и ИИ, который немного выше.
800
Полностью согласен - Flower labs еще одна группа, активно публикующая отличные материалы и теперь сосредоточенная на децентрализованном обучении. Это должно стать важной точкой данных для всех, кто все еще скептически относится к этой области - команда Flower настолько легитимна, насколько это возможно, а Ник Лейн, по сути, находится на вершине в области федеративного обучения.
Каждый сигнал для меня указывает на то, что мы находимся на пороге огромного академического перелома в этой области в сфере машинного обучения. Это уже не просто контрарная позиция, это явно ранние дни того, что станет важной и очень влиятельной областью.

nic lane16 июл., 19:35
Поздравляю с публикацией, @_AlexanderLong. Но вы упустили @flwrlabs, который опубликовал полную систему (photon) с проверенной в реальных условиях полностью децентрализованной тренировкой до 13B на @MLSysConf. Вместе с ключевой техникой децентрализованного стека (разделенные эмбеддинги), опубликованной в устной форме на @iclr_conf. Это была работа, выполненная совместно с @CaMLSys в @Cambridge_Uni.
1,03K
Alexander Long сделал репост
Согласно моему опыту, получить публикацию по децентрализованному DL на конференциях высокого уровня может быть довольно сложно. Мотивация не знакома многим рецензентам, а стандартные условия эксперимента не учитывают проблемы, которые вы стремитесь решить.
Поэтому я очень рад видеть компании, такие как @PluralisHQ и @PrimeIntellect, которые прилагают усилия, чтобы поделиться своими результатами и опубликовать их на крупных конференциях! На мой взгляд, даже подготовка к подаче заставляет вас быть более строгими в отношении ваших экспериментов, а внешняя обратная связь от рецензентов помогает вам уточнить сообщение статьи.
7,24K
Чувствую, что закрытие моделей Meta было очень предсказуемым. Я прямо сказал, что это произойдет в прошлом году, и объяснил почему (из ).


Shane Gu15 июл., 05:35
Покойся с миром, единороги стартапов ИИ, у которых нет продуктов, нет базовых моделей и которые просто собирались полагаться на крупные лаборатории, выпускающие открытые модели бесплатно для объединения моделей. Я знаю один или два таких.

3,63K
Для людей, не знакомых с публикацией в области ИИ, существует 3 основных конференции каждый год: ICML, ICLR и NeurIPS. Это технические конференции и эквивалент журналов в других дисциплинах - они являются основным местом публикации для ИИ. Конкуренция за публикацию статей на этих конференциях сейчас достигла абсурдного уровня, получить одобрение статей очень сложно, и существует много беспокойства по поводу процесса рецензирования, который в данный момент довольно шумный. Сильная статья без недостатков имеет около 50% шансов на принятие, и обычно статья подается с изменениями рецензентов несколько раз, прежде чем ее примут. Несмотря на все это, статьи на этих площадках остаются основным знаком легитимности в мире ИИ и, вероятно, все еще являются основными карьерными метриками для исследователей в области машинного обучения (хотя, на мой взгляд, это ослабевает, так как большая часть исследований в передовых лабораториях не публикуется).
Статьи основного трека значительно отличаются от статей семинаров. Основной трек имеет интенсивное, серьезное рецензирование. Статьи семинаров предназначены для предварительных работ, которые дают некоторое представление об интересном результате, но либо не завершены, либо результат недостаточно значителен для основного трека. Они должны быть рецензированы только пулом рецензентов семинара и не появляются в материалах конференции.
Многие отличные статьи впервые появились на семинарах (например, grokking) - но статьи семинаров и основного трека являются принципиально разными вещами с принципиально разным уровнем влияния. Единственные две компании в области децентрализованного ИИ, которые имеют статьи основного трека в этом году, это @PrimeIntellect и Pluralis.
18,78K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные