DeepSeek uvádí na trh V3.1, sjednocuje V3 a R1 do hybridního modelu uvažování s postupným zvyšováním inteligence Přírůstkové zvýšení inteligence: Počáteční výsledky benchmarkingu pro DeepSeek V3.1 ukazují index umělé analýzy 60 v režimu uvažování, což je nárůst oproti skóre R1 59. V režimu bez uvažování dosahuje verze V3.1 skóre 49, což je větší nárůst oproti dřívějšímu skóre V3 0324 44. To nechává V3.1 (uvažování) za nejnovějším Qwen3 235B 2507 (uvažování) - DeepSeek si nevzal zpět vedení. Hybridní uvažování: @deepseek_ai poprvé přešla na hybridní model uvažování, který podporuje režimy uvažování i bez uvažování. Přechod společnosti DeepSeek na jednotný model hybridního uvažování napodobuje přístup společností OpenAI, Anthropic a Google. Je však zajímavé poznamenat, že Alibaba nedávno opustila svůj hybridní přístup, který upřednostňovala pro Qwen3 se svými samostatnými vydáními modelů uvažování a instrukcí Qwen3 2507. Volání funkcí / použití nástroje: Zatímco DeepSeek tvrdí, že pro model je vylepšeno volání funkcí, DeepSeek V3.1 nepodporuje volání funkcí v režimu uvažování. To pravděpodobně podstatně omezí jeho schopnost podporovat agentské pracovní postupy s požadavky na inteligenci, včetně kódovacích agentů. Použití tokenů: DeepSeek V3.1 má v režimu uvažování přírůstkově vyšší skóre než DeepSeek R1 a používá o něco méně tokenů napříč hodnoceními, která používáme pro Artificial Analysis Intelligence Index. V režimu nerozumu používá o něco více tokenů než V3 0324 - ale stále několikanásobně méně než ve svém vlastním režimu uvažování. API: API první strany DeepSeek nyní poskytuje nový model DeepSeek V3.1 na svých koncových bodech chatu i uvažování – jednoduše změní, zda </think> je modelu v šabloně chatu poskytnut token koncového myšlení, aby bylo možné určit, zda bude model uvažovat. Architektura: DeepSeek V3.1 je architektonicky identický s předchozími modely V3 a R1, s celkovými parametry 671B a aktivními parametry 37B. Důsledky: Doporučujeme opatrnost při vytváření jakýchkoli předpokladů o tom, co toto vydání znamená o pokroku společnosti DeepSeek směrem k budoucímu modelu, který je v pověstech označován jako V4 nebo R2. Podotýkáme, že společnost DeepSeek již dříve vydala finální model postavený na jejich architektuře V2 10. prosince 2024, pouhé dva týdny před vydáním V3.
70,8K