Isso é excepcional! Definitivamente, estou tentando resolver um problema em que estou trabalhando agora, onde modelos "mais inteligentes" estão superproduzindo, resultando em resultados ruins. Os caras da @OpenPipeAI cozinharam com ART e @mattshumer_ está definitivamente empurrando o envelope.
Matt Shumer
Matt Shumer30 de jul. de 2025
Apresentando o 'AutoRL' 📈 A maneira mais simples do mundo de treinar um LLM específico para tarefas com RL. *Basta escrever uma FRASE descrevendo o modelo que você deseja.* Uma cadeia de sistemas de IA gerará dados + rubricas e treinará um modelo para você. Desenvolvido por ART, é de código aberto. Link no tópico:
4,05K