المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nous Research
Atropos v0.3 خارج الآن!
شهد إطار عمل RL Environments الخاص بنا الكثير من الترقيات منذ الإصدار 0.2 - بعض النقاط البارزة:
- يمكن الآن استخدام Atropos كإطار عمل للمقارنة المعيارية والتقييمات من قبل @rogershijin ، مع أول معيار خارجي لدينا ، Reward-Bench 2!
- تمت إضافة Reasoning Gym ، وهو عبارة عن صالة ألعاب رياضية خارجية تم نقلها إلى atropos مع أكثر من 100 مهمة تفكير من قبل @neurosp1ke والأصدقاء
- @max_paperclips معسكر تدريبي متكامل للمنطق في @intern_lm ، مضيفا 1000+ مهمة تفكير جديدة ل RL
- أضاف @dmayhem93 المهندس الرئيسي لشركة Atropos العشرات من إصلاحات الأخطاء وغيرها من تحسينات الموثوقية والتوافق ، ودعم أفضل للبيئات المتعددة ، و CI / CD
- تم دمج العديد من بيئات هاكاثون Atropos في /environments/community - لإدراجها جميعا ستشغل معظم مساحة الشاشة ، ولكن بعض النقاط البارزة:
VR-CLI بواسطة @JakeABoggs ، Philosophy RLAIF ، Adaptive LLM Teachers ، WebVoyager ، تصميم البروتين بواسطة @hallerite ، بيئة توجيه نموذجية بواسطة @gabinfay ، متعددة على إثبات الهزيل ، ساحة catbot ، مواجهة البوكيمون ، البوكر ، الأطباء المتعاونين ، الشعر السنسكريتي من @khoomeik وأكثر من ذلك بكثير!
- تشمل البيئات الجديدة البارزة الأخرى المدعومة رسميا ما يلي:
تنسيق الإجابة بعد البيئة
بيئة pydantic إلى JSON المنقولة من عمل @MatternJustus
التعليمات التالية المنقولة من عمل @natolambert و @allen_ai
عد الحروف
- 47 مساهما جديدا تماما!
تحقق من سجل التغيير الكامل هنا:

Teknium (e/λ)18 يوليو، 03:22
Just merged a PR for an environment to improve LLM as a Judge as well as evaluate models on their capability of doing judgements!
Did you know that all verifiable RL environments are nearly equivalent to benchmarks (and vice-versa!)? So we added an evaluate command to Atropos' base and now you can run benchmarks through Atropos environments.
We got frustrated with working with so many benchmark frameworks that were outdated or unusable, so we implemented evaluation-only mode into Atropos, our RL environments framework.
So our first port from outside our existing environments was @natolambert's Reward-Bench!
Note: it only supports generative reward models (regular LLM Judges) at the moment.
Check out the PR here:

24.88K
Nous Research أعاد النشر
كان من الممتع العمل مع فريق @huggingface لجعل هذه الميزة حقيقة واقعة! شكرا على كل عملك وإبداعك @pcuenq @reach_vb @julien_c @ariG23498!
أيضا بفضل @NousResearch @Teknium1 @Euclaise_ لكونها من أوائل المتبنين لأجهزة الكمبيوتر المحمولة النموذجية المخصصة والعمل على هذا معنا!
31.37K
لقد أجرينا بعض التحديثات على واجهة برمجة التطبيقات الخاصة بنا و NousChat خلال الأسابيع القليلة الماضية:
لم يعد الوصول إلى واجهة برمجة تطبيقات الاستدلال خلف قائمة الانتظار: يحصل المستخدمون الجدد على وصول فوري
Hermes-3-Llama-3.1-405B متاح الآن عبر واجهة برمجة التطبيقات (بالإضافة إلى Hermes-3-Llama-3.1-70B و DeepHermes-3-Llam-3-8B-Preview و DeepHermes-3-Mistral-24B-Preview)
تم مضاعفة حدود معدل واجهة برمجة التطبيقات (الآن 100 دورة في الدقيقة و 80 ألف طن في الدقيقة)
ويتم طرح تجربة الدردشة الجديدة الخاصة بنا في
حساب الدردشة الخاص بك مرتبط بحسابك في حتى يمكن استخدام أرصدة واجهة برمجة التطبيقات الخاصة بك للتفاعل مع الدردشة.

19.72K
الأفضل
المُتصدِّرة
التطبيقات المفضلة
رائج على السلسة
رائج على منصة X
أهم عمليات التمويل الأخيرة
الأبرز