🎉 Gratulacje dla @nvidia z okazji wydania Nemotron 3 Super — wsparcie day-0 w vLLM v0.17.1! Zweryfikowane na GPU NVIDIA. 120B hybrydowy MoE, tylko 12B aktywnych podczas wnioskowania. Duże ulepszenia w porównaniu do poprzedniego Nemotron Super: - 5x wyższa przepustowość - 2x wyższa dokładność w Indeksie Sztucznej Analizy Inteligencji - Multi-Token Prediction (MTP) dla szybszej generacji długich form - Konfigurowalny budżet myślenia — dostosuj dokładność w porównaniu do kosztu tokenów na zadanie - 1M okno kontekstu tokenów Obsługuje BF16, FP8 i NVFP4. Całkowicie otwarte: wagi, zbiory danych, przepisy. Blog: 🤝 Dziękujemy zespołowi Nemotron @NVIDIAAIDev i współtwórcom społeczności vLLM!