Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Мы опубликовали позиционную статью, в которой вместе со многими представителями отрасли призываем к работе над надежностью цепочки размышлений. Это возможность обучить модели быть интерпретируемыми.
Мы инвестируем в эту область в OpenAI, и эта точка зрения отражена в наших продуктах:

16 июл., 00:23
Я чрезвычайно рад потенциалу верности и интерпретируемости цепочек размышлений. Это значительно повлияло на дизайн наших моделей рассуждений, начиная с o1-preview.
Поскольку системы ИИ тратят больше вычислительных ресурсов, например, на долгосрочные исследовательские задачи, критически важно, чтобы у нас был способ мониторинга их внутренних процессов. Прекрасное свойство скрытых цепочек размышлений заключается в том, что, хотя они изначально основаны на языке, который мы можем интерпретировать, процедура масштабируемой оптимизации не противоречит способности наблюдателя проверять намерения модели - в отличие, например, от прямого контроля с помощью модели вознаграждения.
Напряжение здесь заключается в том, что если бы цепочки размышлений по умолчанию не были скрыты, и мы рассматривали бы процесс как часть вывода ИИ, было бы много стимулов (а в некоторых случаях и необходимости) установить надзор за этим. Я верю, что мы можем работать над лучшим из обоих миров - обучать наши модели хорошо объяснять свои внутренние рассуждения, но в то же время сохранять возможность время от времени проверять их.
Верность цепочек размышлений является частью более широкого направления исследований, которое заключается в обучении интерпретируемости: установление целей таким образом, чтобы обучить хотя бы часть системы оставаться честной и контролируемой в масштабе. Мы продолжаем увеличивать наши инвестиции в это исследование в OpenAI.
158,51K
Топ
Рейтинг
Избранное