分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

1/ RL Swarm の新しいバックエンド、GenRL をご紹介します。分散型のフォールトトレラントトレーニング用に構築されたモジュール式の強化学習ライブラリで、RL Swarmをゼロから強化しています。🧵

2/ 各ワーカーは、独自の環境インスタンスを実行し、共有ロールアウトバッファーに非同期的に貢献し、モデルの重みを個別に更新するため、中央コントローラーは必要ありません。

3/ GenRLを使用すると、RL Swarmは、コードで直感的に記述されたあらゆる環境で動作できます。このリリースには、すぐに使用できる Reasoning Gym が組み込まれており、追加の構成を必要とせずに、コミュニティが作成した >100 の環境にアクセスできるようになります。

4/ 新機能: – モジュラー GenRL バックエンド – 拡張された構成サーフェス –簡単にデプロイできる事前構築済みのDockerイメージ – モデル推論能力を強化するための推論ジム環境 –新しいマルチタスクスウォーム

5/ 現在、Gensynテストネットで公開されています。 RL-Swarm は、今日から GenRL で実行できます。フルコード+セットアップ:

52.15K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable