Introductie van `AutoRL` 📈 De eenvoudigste manier ter wereld om een taak-specifiek LLM te trainen met RL. *Schrijf gewoon een ZIN die het model beschrijft dat je wilt.* Een keten van AI-systemen genereert gegevens + rubrieken en traint een model voor jou. Aangedreven door ART, het is open source. Link in de thread:
@theRohitDas Voor deze run heb ik $0 aan de GPU uitgegeven en 40 cent aan OpenRouter-tegoeden voor promptgeneratie, RULER-ranking, enz.
140,28K