minha palestra completa da feira mundial da AIE já está disponível :)
AI Engineer
AI Engineer8 de jul., 01:34
🆕 Treinamento de raciocinadores agenciais o recurso de hoje é o retorno triunfante de @willccbb à pista RL do palco AIE - agora como parte de @PrimeIntellect! Muitos construtores de agentes estão basicamente fazendo "RL à mão". Ele explica de forma concisa os algoritmos atuais de RL em um slide (!), mas depois argumenta que a RL - particularmente para modelos abertos - está presa na terra de perguntas e respostas de matemática e código a nova gostosura é RL agêntica de várias voltas, e a nova biblioteca de verificadores é o kit de ferramentas definitivo para construir um agente e transformá-lo em um loop de RL. Mais pessoas deveriam explorar a construção de melhores modelos de agentes e Will + PI está permitindo isso para todos!
feedsImage
14,76K