Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
Presentiamo il nuovo backend di RL Swarm: GenRL.
Una libreria di apprendimento per rinforzo modulare costruita per un training distribuito e tollerante ai guasti - ora alimenta RL Swarm dalle fondamenta. 🧵
2/
Ogni lavoratore esegue la propria istanza ambientale, contribuisce in modo asincrono a un buffer di rollout condiviso e aggiorna i propri pesi del modello in modo indipendente, quindi non è necessario un controller centrale.
3/
GenRL consente a RL Swarm di funzionare con qualsiasi ambiente, descritto in modo intuitivo attraverso il codice.
Questo lancio incorpora Reasoning Gym pronto all'uso, che dà accesso a >100 ambienti creati dalla community senza necessità di ulteriori configurazioni.
4/
Cosa c'è di nuovo:
– Backend GenRL modulare
– Superficie di configurazione ampliata
– Immagine Docker precompilata per un facile deployment
– Ambiente Reasoning Gym per migliorare le capacità di ragionamento del modello
– Nuovo sciame multi-task
5/
Ora attivo sulla testnet di Gensyn.
Puoi eseguire RL-Swarm con GenRL oggi.
Codice completo + configurazione:
52,15K
Principali
Ranking
Preferiti