Vi introduserer «AutoRL» 📈 Verdens enkleste måte å trene en oppgavespesifikk LLM med RL. *Bare skriv en SETNING som beskriver modellen du ønsker.* En kjede av AI-systemer vil generere data + rubrikker og trene en modell for deg. Drevet av ART, er det åpen kildekode. Lenke i tråden:
@theRohitDas For denne kjøringen brukte jeg $0 på GPU, og 40 cent på OpenRouter-kreditter for rask generering, RULER-rangering, etc.
139,79K