1/ Vi presenterar RL Swarms nya backend: GenRL. Ett modulärt bibliotek för förstärkt inlärning byggt för distribuerad, feltolerant träning – som nu driver RL Swarm från grunden. 🧵
2/ Varje arbetare kör sin egen miljöinstans, bidrar asynkront till en delad distributionsbuffert och uppdaterar sina modellvikter oberoende av varandra, så att ingen central styrenhet krävs.
3/ GenRL gör det möjligt för RL Swarm att arbeta med vilken miljö som helst, beskriven intuitivt genom kod. Den här lanseringen innehåller Reasoning Gym direkt ur lådan, vilket ger tillgång till > 100 community-skapade miljöer utan att någon extra konfiguration krävs.
4/ Vad är det senaste: – Modulär GenRL-backend – Utökad konfigurationsyta – Förbyggd Docker-avbildning för enkel distribution – Reasoning Gym-miljö för att förbättra modellens resonemangsförmåga – Ny flerfunktionssvärm
5/ Nu live på Gensyns testnät. Du kan köra RL-Swarm med GenRL idag. Fullständig kod + installation:
52,17K