🆕 Szkolenie Agentów Rozumujących Dzisiejsza funkcja to triumfalny powrót @willccbb na scenę AIE w ścieżce RL - teraz jako część @PrimeIntellect! Wielu twórców agentów zasadniczo robi "RL ręcznie". On zwięźle wyjaśnia obecne algorytmy RL na jednym slajdzie (!) ale potem argumentuje, że RL - szczególnie dla otwartych modeli - utknęło w matematyce i pytaniach dotyczących kodu. Nowym hitem jest wieloetapowe agentowe RL, a nowa biblioteka weryfikatorów to ostateczny zestaw narzędzi do budowania agenta i przekształcania go w pętlę RL. Więcej osób powinno badać budowanie lepszych modeli agentów, a Will + PI umożliwiają to wszystkim!
feedsImage
47,6K