Quer começar a explorar o RL? O caderno AutoRL do Matt é O lugar para começar. Aqui está a longa lista de coisas que você precisa antes de começar: - uma descrição da tarefa em uma linha do que você quer que seu modelo faça
Matt Shumer
Matt Shumer30/07/2025
Apresentando `AutoRL` 📈 A forma mais simples do mundo para treinar um LLM específico para uma tarefa com RL. *Basta escrever uma FRASE descrevendo o modelo que você deseja.* Uma cadeia de sistemas de IA gerará dados + rubricas e treinará um modelo para você. Impulsionado pela ART, é código aberto. Link no tópico:
10,54K