Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
моя повна доповідь з AIE World Fair вже вийшла :)

8 лип., 01:34
🆕 Навчання агентних міркувань
Фішка сьогоднішнього дня - тріумфальне повернення @willccbb на трасу AIE stage RL - тепер в рамках @PrimeIntellect!
Багато агентів-будівельників в основному роблять "RL вручну". Він лаконічно пояснює поточні алгоритми RL на одному слайді (!), але потім стверджує, що RL - особливо для відкритих моделей - застряг у математиці та питаннях і відповідях коду
нова гарячість — це багатооборотний агентний RL, а нова бібліотека верифікаторів — це найкращий набір інструментів для створення агента та перетворення його на цикл RL.
Все більше людей повинні досліджувати створення кращих моделей агентів, і Will + PI дозволяє це робити для всіх!



14,75K
Найкращі
Рейтинг
Вибране