Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
Představujeme nový backend RL Swarm: GenRL.
Modulární knihovna zpětnovazebního učení vytvořená pro distribuované školení odolné proti chybám - nyní pohání RL Swarm od základů. 🧵
2/
Každý pracovník provozuje svou vlastní instanci prostředí, asynchronně přispívá do sdílené vyrovnávací paměti pro zavádění a nezávisle aktualizuje váhy modelu, takže není potřeba žádný centrální řadič.
3/
GenRL umožňuje RL Swarm pracovat s libovolným prostředím, které je intuitivně popsáno prostřednictvím kódu.
Toto uvedení na trh zahrnuje Reasoning Gym hned po vybalení, což umožňuje přístup k >100 komunitou vytvořeným prostředím bez nutnosti další konfigurace.
4/
Co je nového:
– Modulární backend GenRL
– Rozšířená konfigurační plocha
– Předpřipravený obraz Docker pro snadné nasazení
– Prostředí posilovny uvažování pro zlepšení schopností modelového uvažování
– Nový víceúčelový roj
5/
Nyní je spuštěn na testovací síti Gensyn.
RL-Swarm můžete spustit s GenRL ještě dnes.
Plný kód + nastavení:
52,15K
Top
Hodnocení
Oblíbené