Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🆕 Formation des Raisonneurs Agentiques
La fonctionnalité d'aujourd'hui est le retour triomphant de @willccbb sur la scène AIE dans la piste RL - maintenant en tant que partie de @PrimeIntellect !
Beaucoup de constructeurs d'agents font essentiellement du "RL à la main". Il explique de manière concise les algorithmes RL actuels en une diapositive (!) mais soutient ensuite que le RL - en particulier pour les modèles ouverts - est coincé dans un monde de questions-réponses mathématiques et de code.
La nouvelle tendance est le RL agentique multi-tours, et la nouvelle bibliothèque de vérificateurs est l'outil ultime pour construire un agent et le transformer en une boucle RL.
Plus de gens devraient explorer la construction de meilleurs modèles d'agents et Will + PI permet cela à tout le monde !



47,6K
Meilleurs
Classement
Favoris