一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

熱門話題

1/ 介紹 RL Swarm 的新後端：GenRL。一個為分散式、容錯訓練而構建的模組化強化學習庫 - 現在從頭開始為 RL Swarm 提供支援。🧵

2/ 每個 worker 都運行自己的環境實例，異步地為共用的 rollout 緩衝區做出貢獻，並獨立更新其模型權重，因此不需要中央控制器。

3/ GenRL 允許 RL Swarm 與任何環境一起工作，通過代碼直觀地描述。此次發佈結合了開箱即用的 Reasoning Gym，無需額外配置即可訪問 >100 個社區創建的環境。

4/ 更新內容： – 模組化 GenRL 後端 – 擴展的配置表面 – 預構建的 Docker 鏡像，便於部署 – Reasoning Gym 環境以增強模型推理能力 – 新的多任務群

5/ 現已上線 Gensyn 測試網。您現在可以使用 GenRL 運行 RL-Swarm。完整代碼 + 設定：

52.15K

熱門

排行

收藏

鏈上熱點

X 熱門榜

近期融資

最受認可