1/ Představujeme nový backend RL Swarm: GenRL. Modulární knihovna zpětnovazebního učení vytvořená pro distribuované školení odolné proti chybám - nyní pohání RL Swarm od základů. 🧵
2/ Každý pracovník provozuje svou vlastní instanci prostředí, asynchronně přispívá do sdílené vyrovnávací paměti pro zavádění a nezávisle aktualizuje váhy modelu, takže není potřeba žádný centrální řadič.
3/ GenRL umožňuje RL Swarm pracovat s libovolným prostředím, které je intuitivně popsáno prostřednictvím kódu. Toto uvedení na trh zahrnuje Reasoning Gym hned po vybalení, což umožňuje přístup k >100 komunitou vytvořeným prostředím bez nutnosti další konfigurace.
4/ Co je nového: – Modulární backend GenRL – Rozšířená konfigurační plocha – Předpřipravený obraz Docker pro snadné nasazení – Prostředí posilovny uvažování pro zlepšení schopností modelového uvažování – Nový víceúčelový roj
5/ Nyní je spuštěn na testovací síti Gensyn. RL-Swarm můžete spustit s GenRL ještě dnes. Plný kód + nastavení:
52,15K