Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
Giới thiệu backend mới của RL Swarm: GenRL.
Một thư viện học tăng cường mô-đun được xây dựng cho việc đào tạo phân tán, chịu lỗi - hiện đang cung cấp sức mạnh cho RL Swarm từ nền tảng. 🧵
2/
Mỗi công nhân chạy một phiên bản môi trường riêng, đóng góp không đồng bộ vào một bộ đệm triển khai chung, và cập nhật trọng số mô hình của mình một cách độc lập, vì vậy không cần một bộ điều khiển trung tâm.
3/
GenRL allows RL Swarm to work with any environment, described intuitively through code.
This launch incorporates Reasoning Gym out-of-the-box, giving access to >100 community-created environments with no extra configuration required.
4/
Những điều mới:
– Backend GenRL mô-đun
– Bề mặt cấu hình mở rộng
– Hình ảnh Docker đã được xây dựng sẵn để dễ dàng triển khai
– Môi trường Reasoning Gym để nâng cao khả năng lý luận của mô hình
– Đàn đa nhiệm mới
5/
Hiện đang hoạt động trên mạng thử nghiệm Gensyn.
Bạn có thể chạy RL-Swarm với GenRL hôm nay.
Mã đầy đủ + thiết lập:
52,16K
Hàng đầu
Thứ hạng
Yêu thích