Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🆕 Entrenando Razonadores Agentes
la característica de hoy es el regreso triunfal de @willccbb al escenario de AIE en la pista de RL - ¡ahora como parte de @PrimeIntellect!
Muchos constructores de agentes básicamente están haciendo "RL a mano". Él explica de manera concisa los algoritmos actuales de RL en una diapositiva (!) pero luego argumenta que RL - particularmente para modelos abiertos - está atrapado en un terreno de preguntas y respuestas de matemáticas y código.
lo nuevo y emocionante es el RL agente multi-turno, y la nueva biblioteca de verificadores es la herramienta definitiva para construir un agente y convertirlo en un bucle de RL.
¡Más personas deberían explorar la construcción de mejores modelos de agentes y Will + PI está habilitando eso para todos!



47,6K
Parte superior
Clasificación
Favoritos