介绍 `AutoRL` 📈 这是训练特定任务 LLM 的最简单方法。 *只需写一句话描述您想要的模型。* 一系列 AI 系统将为您生成数据 + 评分标准并训练模型。 由 ART 提供支持,开源。 线程中的链接:
@theRohitDas 在这次运行中,我在GPU上花费了$0,在OpenRouter积分上花费了40美分用于提示生成、RULER排名等。
139.78K