Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jason Wei
Исследователь ИИ @openai
Jason Wei сделал репост
📣 С радостью делимся нашим реальным исследованием клинического помощника на основе LLM, совместной работы @OpenAI и @PendaHealth.
На основе 39,849 живых посещений пациентов, клиницисты с ИИ показали 16% относительное снижение диагностических ошибок и 13% снижение ошибок в лечении по сравнению с теми, кто не использовал ИИ. 🧵
296,98K
Jason Wei сделал репост
Это моя лекция двухмесячной давности в @Cornell
"Как мне увеличить свою продуктивность?" Один естественный ответ: "Я просто поработаю еще несколько часов." Долгая работа может помочь, но в конечном итоге вы достигаете физического предела.
Лучший вопрос: "Как мне увеличить свою продуктивность, не увеличивая затраты так сильно?" Это и есть рычаг.
Мы так часто слышим слово "рычаг", что его значение легко упустить из виду. Моя любимая классификация рычагов принадлежит Навалу Равиканту: человеческий труд, капитал и код / медиа. Каждый из них стал основой крупных волн создания богатства в истории.
Однако, как только источник рычага становится популярным (вспомните YouTube-каналы сегодня по сравнению с десятью годами назад), конкуренция сжимает маржу. Поэтому, когда появляется новый рычаг, это редкая возможность для значительных доходов.
В этом выступлении я описываю ИИ как этот новый рычаг. Агент ИИ сочетает в себе рычаг труда (он работает на вас и не требует разрешения) с рычагом кода (вы можете его копировать и вставлять).
Сказать, что ИИ создаст огромное богатство, стало клише. Но использование этой перспективы рычага позволяет нам интерпретировать шумный новостной цикл об ИИ последовательно и выявлять реальные возможности.
Спасибо @unsojo за то, что пригласили меня!
402,42K
Новая запись в блоге о асимметрии верификации и "законе верификатора":
Асимметрия верификации — это идея о том, что некоторые задачи гораздо легче проверить, чем решить, и она становится важной концепцией, поскольку у нас есть RL, который наконец работает в общем случае.
Отличные примеры асимметрии верификации — это такие вещи, как судоку, написание кода для веб-сайта, подобного Instagram, и задачи BrowseComp (требуется ~100 веб-сайтов, чтобы найти ответ, но легко проверить, когда у вас есть ответ).
Другие задачи имеют почти симметрию верификации, такие как сложение двух 900-значных чисел или некоторые скрипты обработки данных. Однако другие задачи гораздо легче предложить осуществимые решения, чем проверить их (например, проверка фактов длинного эссе или утверждение новой диеты, такой как "едим только бизонов").
Важно понимать, что асимметрию верификации можно улучшить, выполнив некоторую работу заранее. Например, если у вас есть ключ ответов к математической задаче или если у вас есть тестовые случаи для задачи Leetcode. Это значительно увеличивает набор задач с желаемой асимметрией верификации.
"Закон верификатора" гласит, что легкость обучения ИИ решать задачу пропорциональна тому, насколько проверяемой является эта задача. Все задачи, которые можно решить и легко проверить, будут решены ИИ. Способность обучать ИИ решать задачу пропорциональна тому, имеет ли задача следующие свойства:
1. Объективная истина: все согласны с тем, что такое хорошие решения
2. Быстрая верификация: любое данное решение можно проверить за несколько секунд
3. Масштабируемая верификация: многие решения можно проверить одновременно
4. Низкий уровень шума: верификация как можно более тесно связана с качеством решения
5. Непрерывная награда: легко оценить качество многих решений для одной проблемы
Одним очевидным воплощением закона верификатора является тот факт, что большинство предложенных в ИИ бенчмарков легко проверить и до сих пор были решены. Обратите внимание, что практически все популярные бенчмарки за последние десять лет соответствуют критериям #1-4; бенчмарки, которые не соответствуют критериям #1-4, будут испытывать трудности с тем, чтобы стать популярными.
Почему проверяемость так важна? Объем обучения в ИИ максимизируется, когда вышеуказанные критерии удовлетворены; вы можете сделать много градиентных шагов, где каждый шаг имеет много сигнала. Скорость итерации критична — это причина, по которой прогресс в цифровом мире был гораздо быстрее, чем прогресс в физическом мире.
AlphaEvolve от Google является одним из величайших примеров использования асимметрии верификации. Он сосредоточен на настройках, которые соответствуют всем вышеуказанным критериям, и привел к ряду достижений в математике и других областях. В отличие от того, что мы делали в ИИ за последние два десятилетия, это новая парадигма, в которой все задачи оптимизируются в условиях, где обучающая выборка эквивалентна тестовой выборке.
Асимметрия верификации повсюду, и это захватывающе — представить мир зазубренного интеллекта, где все, что мы можем измерить, будет решено.

298,81K
прямо огонь, я прочитал сразу

Kevin Lu10 июл., 00:01
Почему вам следует прекратить заниматься исследованиями в области RL и вместо этого работать над продуктом //
Технология, которая открыла большой сдвиг в масштабировании ИИ, — это интернет, а не трансформеры.
Я думаю, что хорошо известно, что данные — это самая важная вещь в ИИ, и также то, что исследователи все равно выбирают не работать над ними. ... Что значит работать с данными (масштабируемым образом)?
Интернет предоставил богатый источник обильных данных, которые были разнообразными, обеспечивали естественную учебную программу, представляли собой компетенции, которые действительно интересуют людей, и были экономически жизнеспособной технологией для развертывания в масштабе — он стал идеальным дополнением к предсказанию следующего токена и был первобытным бульоном для взлета ИИ.
Без трансформеров любое количество подходов могло бы взлететь, мы, вероятно, могли бы иметь CNN или модели пространственного состояния на уровне GPT-4.5. Но с тех пор, как появился GPT-4, не было драматического улучшения базовых моделей. Модели рассуждений хороши в узких областях, но не представляют собой такой огромный скачок, как GPT-4 в марте 2023 года (более 2 лет назад...)
У нас есть что-то великое с обучением с подкреплением, но мой глубокий страх заключается в том, что мы повторим ошибки прошлого (эпоха RL 2015-2020) и будем заниматься исследованиями RL, которые не имеют значения.
Таким образом, как интернет был двойником контролируемого предварительного обучения, что будет двойником RL, который приведет к массовому прогрессу, подобному GPT-1 -> GPT-4? Я думаю, что это похоже на совместное проектирование исследований и продуктов.

18,66K
У нас еще нет ИИ, который самосовершенствуется, и когда он появится, это станет настоящим прорывом. С учетом большего опыта по сравнению с временами GPT-4, очевидно, что это не будет "быстрым взлетом", а скорее крайне постепенным процессом, вероятно, на протяжении десятилетия.
Первое, что нужно знать, это то, что самосовершенствование, т.е. модели, обучающие сами себя, не является бинарным процессом. Рассмотрим сценарий, когда GPT-5 обучает GPT-6, что было бы невероятно. Сможет ли GPT-5 вдруг перейти от полной неспособности обучать GPT-6 к тому, чтобы делать это крайне эффективно? Определенно нет. Первые запуски обучения GPT-6, вероятно, будут крайне неэффективными по времени и вычислительным ресурсам по сравнению с человеческими исследователями. И только после множества попыток GPT-5 действительно сможет обучать GPT-6 лучше, чем люди.
Во-вторых, даже если модель сможет обучать саму себя, она не станет внезапно лучше во всех областях. Существует градиент сложности в том, насколько трудно улучшить себя в различных областях. Например, возможно, что самосовершенствование сработает в первую очередь в областях, которые мы уже знаем, как легко исправить после обучения, таких как базовые галлюцинации или стиль. Далее будут математика и программирование, что требует больше усилий, но для этого уже существуют установленные методы улучшения моделей. А затем, в крайнем случае, можно представить, что есть некоторые задачи, которые очень трудны для самосовершенствования. Например, способность говорить на тлингите, языке коренных американцев, на котором говорит около 500 человек. Модели будет очень трудно самосовершенствоваться в разговоре на тлингите, так как у нас еще нет способов решения проблем с языками с низкими ресурсами, кроме как сбором дополнительных данных, что займет время. Поэтому из-за градиента сложности самосовершенствования это не произойдет сразу.
Наконец, возможно, это спорно, но в конечном итоге прогресс в науке сдерживается реальными экспериментами. Некоторые могут считать, что чтение всех статей по биологии даст нам лекарство от рака, или что чтение всех статей по машинному обучению и освоение всей математики позволит вам идеально обучить GPT-10. Если бы это было так, то люди, которые читают больше всего статей и изучают больше всего теории, были бы лучшими исследователями ИИ. Но на самом деле произошло так, что ИИ (и многие другие области) стали доминировать безжалостно эмпирическими исследователями, что отражает, насколько прогресс основан на реальных экспериментах, а не на чистом интеллекте. Так что моя точка зрения заключается в том, что хотя суперумный агент может разработать эксперименты, которые в 2 или даже 5 раз лучше, чем у наших лучших человеческих исследователей, в конечном итоге им все равно придется ждать, пока эксперименты будут проведены, что будет ускорением, но не быстрым взлетом.
В заключение, существует множество узких мест для прогресса, не только чистый интеллект или система самосовершенствования. ИИ решит множество задач, но каждая область имеет свою собственную скорость прогресса. И даже самый высокий интеллект все равно потребует экспериментов в реальном мире. Так что это будет ускорение, а не быстрый взлет, спасибо за то, что прочитали мой монолог.
339,9K
Я бы сказал, что мы безусловно находимся на уровне AGI, когда ИИ сможет создать настоящего, живого единорога. И нет, я не имею в виду компанию стоимостью $1 млрд, вы, nerds, я имею в виду буквального розового коня с спиральным рогом. Парагон научного прогресса в области генетической инженерии и программирования клеток. То, о чем мечтали в детстве. Осмелюсь сказать, что это произойдет в нашей жизни.
84,32K
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные