Presentamos `AutoRL` 📈 La forma más sencilla del mundo para entrenar un LLM específico para una tarea con RL. *Solo escribe una ORACIÓN describiendo el modelo que deseas.* Una cadena de sistemas de IA generará datos + rúbricas y entrenará un modelo para ti. Impulsado por ART, es de código abierto. Enlace en el hilo:
@theRohitDas Para esta ejecución, gasté $0 en la GPU y 40 centavos en créditos de OpenRouter para la generación de prompts, clasificación RULER, etc.
140,29K