Хочете намочити ноги за допомогою RL? Блокнот Matt AutoRL – це місце, з якого варто почати. Ось довгий список речей, які вам потрібно перед початком: - Однорядковий опис того, що ви хочете, щоб ваша модель робила
Matt Shumer
Matt Shumer30 лип. 2025 р.
Представляємо 'AutoRL' 📈 Найпростіший у світі спосіб тренування LLM для конкретного завдання за допомогою RL. *Просто напишіть РЕЧЕННЯ з описом моделі, яку ви хочете.* Ланцюжок систем штучного інтелекту згенерує дані + рубрики та навчить модель для вас. Працює на основі ART і має відкритий вихідний код. Посилання в темі:
10,48K