¿Buscas mojarte con RL? El cuaderno AutoRL de Matt es EL lugar para comenzar. Aquí está la larga lista de cosas que necesitas antes de empezar: - una línea de descripción de la tarea de lo que quieres que haga tu modelo
Matt Shumer
Matt Shumer30 jul 2025
Presentamos `AutoRL` 📈 La forma más simple del mundo para entrenar un LLM específico para tareas con RL. *Solo escribe una ORACIÓN describiendo el modelo que deseas.* Una cadena de sistemas de IA generará datos + rúbricas y entrenará un modelo para ti. Impulsado por ART, es de código abierto. Enlace en el hilo:
10.48K