моя повна доповідь з AIE World Fair вже вийшла :)
AI Engineer
AI Engineer8 лип., 01:34
🆕 Навчання агентних міркувань Фішка сьогоднішнього дня - тріумфальне повернення @willccbb на трасу AIE stage RL - тепер в рамках @PrimeIntellect! Багато агентів-будівельників в основному роблять "RL вручну". Він лаконічно пояснює поточні алгоритми RL на одному слайді (!), але потім стверджує, що RL - особливо для відкритих моделей - застряг у математиці та питаннях і відповідях коду нова гарячість — це багатооборотний агентний RL, а нова бібліотека верифікаторів — це найкращий набір інструментів для створення агента та перетворення його на цикл RL. Все більше людей повинні досліджувати створення кращих моделей агентів, і Will + PI дозволяє це робити для всіх!
feedsImage
14,75K