介紹 `AutoRL` 📈 世界上最簡單的方式來訓練一個特定任務的 LLM,使用強化學習。 *只需寫一句話描述您想要的模型。* 一系列 AI 系統將生成數據 + 評分標準並為您訓練模型。 由 ART 提供支持,這是開源的。 線程中的鏈接:
@theRohitDas 在這次運行中,我在 GPU 上花了 $0,並在 OpenRouter 積分上花了 40 美分,用於提示生成、RULER 排名等。
140.29K