Представляємо 'AutoRL' 📈 Найпростіший у світі спосіб тренування LLM для конкретного завдання за допомогою RL. *Просто напишіть РЕЧЕННЯ з описом моделі, яку ви хочете.* Ланцюжок систем штучного інтелекту згенерує дані + рубрики та навчить модель для вас. Працює на основі ART і має відкритий вихідний код. Посилання в темі:
@theRohitDas За цей запуск я витратив 0 доларів на графічний процесор і 40 центів на кредити OpenRouter за швидку генерацію, рейтинг RULER тощо.
140,28K