Memperkenalkan 'AutoRL' 📈 Cara tersederhana di dunia untuk melatih LLM khusus tugas dengan RL. *Cukup tulis KALIMAT yang menjelaskan model yang Anda inginkan.* Rantai sistem AI akan menghasilkan data + rubrik dan melatih model untuk Anda. Didukung oleh ART, ini adalah open source. Tautan di utas:
@theRohitDas Untuk lari ini, saya menghabiskan $0 untuk GPU, dan 40 sen untuk kredit OpenRouter untuk pembuatan cepat, peringkat RULER, dll.
140,28K