Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
моя полная речь с выставки AIE теперь доступна :)

8 июл., 01:34
🆕 Обучение агентных рассуждений
Сегодняшняя особенность - триумфальное возвращение @willccbb на сцену AIE в треке RL - теперь в составе @PrimeIntellect!
Многие создатели агентов по сути делают "RL вручную". Он лаконично объясняет текущие алгоритмы RL на одном слайде (!) и затем утверждает, что RL - особенно для открытых моделей - застрял в мире математических и кодовых вопросов и ответов.
Новая горячая тема - многоповоротный агентный RL, а новая библиотека проверок - это идеальный инструмент для создания агента и превращения его в RL-цикл.
Больше людей должны исследовать создание лучших моделей агентов, и Уилл + PI делают это возможным для всех!



14,76K
Топ
Рейтинг
Избранное