1/ Presentiamo il nuovo backend di RL Swarm: GenRL. Una libreria di apprendimento per rinforzo modulare costruita per un training distribuito e tollerante ai guasti - ora alimenta RL Swarm dalle fondamenta. 🧵
2/ Ogni lavoratore esegue la propria istanza ambientale, contribuisce in modo asincrono a un buffer di rollout condiviso e aggiorna i propri pesi del modello in modo indipendente, quindi non è necessario un controller centrale.
3/ GenRL consente a RL Swarm di funzionare con qualsiasi ambiente, descritto in modo intuitivo attraverso il codice. Questo lancio incorpora Reasoning Gym pronto all'uso, che dà accesso a >100 ambienti creati dalla community senza necessità di ulteriori configurazioni.
4/ Cosa c'è di nuovo: – Backend GenRL modulare – Superficie di configurazione ampliata – Immagine Docker precompilata per un facile deployment – Ambiente Reasoning Gym per migliorare le capacità di ragionamento del modello – Nuovo sciame multi-task
5/ Ora attivo sulla testnet di Gensyn. Puoi eseguire RL-Swarm con GenRL oggi. Codice completo + configurazione:
52,15K