🆕 Training agentische Denker Das heutige Feature ist @willccbb's triumphale Rückkehr auf die AIE-Bühne im RL-Track - jetzt als Teil von @PrimeIntellect! Viele Agentenbauer machen im Grunde "RL von Hand". Er erklärt prägnant die aktuellen RL-Algorithmen auf einer Folie (!) und argumentiert dann, dass RL - insbesondere für offene Modelle - in der Mathematik und im Code-Q&A feststeckt. Der neue Trend ist multi-turn agentisches RL, und die neue Verifiers-Bibliothek ist das ultimative Toolkit zum Erstellen eines Agenten und dessen Umwandlung in eine RL-Schleife. Mehr Menschen sollten erkunden, wie sie bessere Agentenmodelle erstellen können, und Will + PI ermöglichen das für alle!
feedsImage
47,6K