想要開始接觸 RL 嗎?Matt 的 AutoRL 筆記本是最好的起點。以下是開始之前你需要的長清單: - 一行任務描述,說明你希望你的模型做什麼
Matt Shumer
Matt Shumer2025年7月30日
介紹 `AutoRL` 📈 世界上最簡單的方式來訓練一個特定任務的 LLM,使用強化學習。 *只需寫一句話描述您想要的模型。* 一系列 AI 系統將生成數據 + 評分標準並為您訓練模型。 由 ART 提供支持,這是開源的。 線程中的鏈接:
10.48K