Apresentando `AutoRL` 📈 A forma mais simples do mundo para treinar um LLM específico para uma tarefa com RL. *Basta escrever uma FRASE descrevendo o modelo que você deseja.* Uma cadeia de sistemas de IA gerará dados + rubricas e treinará um modelo para você. Impulsionado pela ART, é código aberto. Link no tópico:
@theRohitDas Para esta execução, gastei $0 na GPU e 40 cêntimos em créditos do OpenRouter para geração de prompts, classificação RULER, etc.
140,28K