🎉 مبروك ل @nvidia على إصدار Nemotron 3 Super — دعم اليوم صفر في vLLM v0.17.1! تم التحقق على بطاقات NVIDIA. 120B مزيج MoE، فقط 12B نشط عند الاستنتاج. ترقيات كبيرة مقارنة بجهاز Nemotron Super السابق: - معدل نقل بيانات أعلى بخمس مرات - دقة أعلى بمرتين في مؤشر الذكاء الاصطناعي للتحليل الاصطناعي. - التنبؤ المتعدد بالرموز (MTP) لتوليد النماذج الطويلة الأسرع - ميزانية التفكير القابلة للتكوين — دقة الاتصال مقابل تكلفة الرمز لكل مهمة - نافذة سياق رمز 1M يدعم BF16 وFP8 وNVFP4. مفتوح بالكامل: الأوزان، مجموعات البيانات، الوصفات. المدونة: 🤝 شكرا @NVIDIAAIDev فريق Nemotron والمساهمين في مجتمع vLLM!