Giới thiệu `AutoRL` 📈 Cách đơn giản nhất trên thế giới để huấn luyện một LLM cụ thể cho nhiệm vụ với RL. *Chỉ cần viết một CÂU mô tả mô hình bạn muốn.* Một chuỗi các hệ thống AI sẽ tạo ra dữ liệu + tiêu chí và huấn luyện một mô hình cho bạn. Được hỗ trợ bởi ART, nó là mã nguồn mở. Liên kết trong chủ đề:
@theRohitDas Trong lần chạy này, tôi đã chi $0 cho GPU, và 40 xu cho tín dụng OpenRouter để tạo prompt, xếp hạng RULER, v.v.
140,3K