🎉 Nemotron 3 Super'in çıkışı nedeniyle @nvidia'yi tebrik ederiz — vLLM v0.17.1'de gün 0 desteği! NVIDIA GPU'larında doğrulandı. 120B hibrit MoE, çıkarımda sadece 12B aktif. Önceki Nemotron Super'a göre büyük yükseltmeler: - 5 kat daha yüksek veri verimliliği - Yapay Analiz Zeka Endeksi'nde 2 kat daha yüksek doğruluk - Daha hızlı uzun form üretim için Çok Token Tahmini (MTP) - Yapılandırılabilir düşünme bütçesi — kadran doğruluğu ile görev başına token maliyeti karşılaştırıldığında - 1M token bağlam penceresi BF16, FP8 ve NVFP4'ü destekliyor. Tamamen açık: ağırlıklar, veri setleri, tarifler. Blog: 🤝 Nemotron ekibi ve vLLM topluluğu katkı sağlayanları @NVIDIAAIDev teşekkürler!