Apresentando o 'AutoRL' 📈 A maneira mais simples do mundo de treinar um LLM específico para tarefas com RL. *Basta escrever uma FRASE descrevendo o modelo que você deseja.* Uma cadeia de sistemas de IA gerará dados + rubricas e treinará um modelo para você. Desenvolvido por ART, é de código aberto. Link no tópico:
@theRohitDas Para esta execução, gastei $ 0 na GPU e 40 centavos em créditos OpenRouter para geração de prompts, classificação RULER, etc.
140,3K