Ønsker du å få føttene våte med RL? Matts AutoRL-notatbok er stedet å starte. Her er den lange listen over ting du trenger før du begynner: - En linjebeskrivelse av hva du vil at modellen skal gjøre
Matt Shumer
Matt Shumer30. juli 2025
Vi introduserer «AutoRL» 📈 Verdens enkleste måte å trene en oppgavespesifikk LLM med RL. *Bare skriv en SETNING som beskriver modellen du ønsker.* En kjede av AI-systemer vil generere data + rubrikker og trene en modell for deg. Drevet av ART, er det åpen kildekode. Lenke i tråden:
10,48K