🆕 Entrenando Razonadores Agentes la característica de hoy es el regreso triunfal de @willccbb al escenario de AIE en la pista de RL - ¡ahora como parte de @PrimeIntellect! Muchos constructores de agentes básicamente están haciendo "RL a mano". Él explica de manera concisa los algoritmos actuales de RL en una diapositiva (!) pero luego argumenta que RL - particularmente para modelos abiertos - está atrapado en un terreno de preguntas y respuestas de matemáticas y código. lo nuevo y emocionante es el RL agente multi-turno, y la nueva biblioteca de verificadores es la herramienta definitiva para construir un agente y convertirlo en un bucle de RL. ¡Más personas deberían explorar la construcción de mejores modelos de agentes y Will + PI está habilitando eso para todos!
feedsImage
47,6K