1/ نقدم لكم الواجهة الخلفية الجديدة ل RL Swarm: GenRL. مكتبة تعليمية معززة معيارية مصممة للتدريب الموزع والمتسامح مع الأخطاء - تعمل الآن على تشغيل RL Swarm من الألف إلى الياء. 🧵
2/ يقوم كل عامل بتشغيل مثيل البيئة الخاص به، ويساهم بشكل غير متزامن في مخزن مؤقت للطرح المشترك، ويقوم بتحديث أوزان النموذج الخاصة به بشكل مستقل، لذلك لا يلزم وجود وحدة تحكم مركزية.
3/ يسمح GenRL ل Swarm بالعمل مع أي بيئة ، موصوفة بشكل حدسي من خلال التعليمات البرمجية. يشتمل هذا الإطلاق على Reasoning Gym خارج الصندوق ، مما يتيح الوصول إلى >100 بيئة أنشأها المجتمع دون الحاجة إلى تكوين إضافي.
4/ ما الجديد: - الواجهة الخلفية المعيارية GenRL - سطح تكوين موسع - صورة Docker مسبقة الصنع لسهولة النشر - بيئة الصالة الرياضية للمنطق لتعزيز قدرات التفكير النموذجي - سرب جديد متعدد المهام
5/ يعيش الآن على شبكة اختبار Gensyn. يمكنك تشغيل RL-Swarm مع GenRL اليوم. الكود الكامل + الإعداد:
‏‎52.16‏K