¡Esto es excepcional! Definitivamente lo probaré para un problema en el que estoy trabajando ahora mismo, donde los modelos "más inteligentes" están sobreproduciendo, lo que resulta en malos resultados. Los chicos de @OpenPipeAI cocinaron con ART y @mattshumer_ definitivamente está empujando los límites.
Matt Shumer
Matt Shumer30 jul 2025
Presentamos `AutoRL` 📈 La forma más simple del mundo para entrenar un LLM específico para tareas con RL. *Solo escribe una ORACIÓN describiendo el modelo que deseas.* Una cadena de sistemas de IA generará datos + rúbricas y entrenará un modelo para ti. Impulsado por ART, es de código abierto. Enlace en el hilo:
4K