Dette er eksepsjonelt! Definitivt å prøve det for et problem jeg jobber med akkurat nå der "smartere" modeller overproduserer, noe som resulterer i dårlige resultater. Gutta på @OpenPipeAI laget mat med ART og @mattshumer_ presser definitivt grensene.
Matt Shumer
Matt Shumer30. juli 2025
Vi introduserer «AutoRL» 📈 Verdens enkleste måte å trene en oppgavespesifikk LLM med RL. *Bare skriv en SETNING som beskriver modellen du ønsker.* En kjede av AI-systemer vil generere data + rubrikker og trene en modell for deg. Drevet av ART, er det åpen kildekode. Lenke i tråden:
4K