Dit is uitzonderlijk! Ik ga het zeker proberen voor een probleem waar ik momenteel aan werk, waarbij "slimmere" modellen overproduceren, wat resulteert in slechte resultaten. De jongens van @OpenPipeAI hebben gekookt met ART en @mattshumer_ duwt zeker de grenzen.
Matt Shumer
Matt Shumer30 jul 2025
Introductie van `AutoRL` 📈 De eenvoudigste manier ter wereld om een taak-specifiek LLM te trainen met RL. *Schrijf gewoon een ZIN die het model beschrijft dat je wilt.* Een keten van AI-systemen genereert gegevens + rubrieken en traint een model voor jou. Aangedreven door ART, het is open source. Link in de thread:
4,05K