這真是太棒了!我一定會嘗試一下,因為我目前正在處理的問題是「更聰明」的模型產出過多,導致結果不佳。@OpenPipeAI 的團隊用 ART 進行了創作,而 @mattshumer_ 無疑在推動邊界。
Matt Shumer
Matt Shumer2025年7月30日
介紹 `AutoRL` 📈 世界上最簡單的方式來訓練一個特定任務的 LLM,使用強化學習。 *只需寫一句話描述您想要的模型。* 一系列 AI 系統將生成數據 + 評分標準並為您訓練模型。 由 ART 提供支持,這是開源的。 線程中的鏈接:
4K