Vrei să-ți udei picioarele cu RL? Notebook-ul AutoRL al lui Matt este locul de unde să începeți. Iată lista lungă de lucruri de care aveți nevoie înainte de a începe: - descrierea sarcinii de o linie a ceea ce doriți să facă modelul dvs.
Matt Shumer
Matt Shumer30 iul. 2025
Vă prezentăm "AutoRL" 📈 Cel mai simplu mod din lume de a antrena un LLM specific sarcinii cu RL. *Doar scrieți o PROPOZIȚIE care descrie modelul dorit.* Un lanț de sisteme AI va genera date + rubrici și va antrena un model pentru dvs. Alimentat de ART, este open source. Link în fir:
10,48K