Ingin membasahi kaki Anda dengan RL? Notebook AutoRL Matt adalah tempat untuk memulai. Berikut adalah daftar panjang hal-hal yang Anda butuhkan sebelum memulai: - Deskripsi tugas satu baris tentang apa yang Anda inginkan untuk dilakukan model Anda
Matt Shumer
Matt Shumer30 Jul 2025
Memperkenalkan 'AutoRL' 📈 Cara tersederhana di dunia untuk melatih LLM khusus tugas dengan RL. *Cukup tulis KALIMAT yang menjelaskan model yang Anda inginkan.* Rantai sistem AI akan menghasilkan data + rubrik dan melatih model untuk Anda. Didukung oleh ART, ini adalah open source. Tautan di utas:
10,54K