Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
DeepSeek uvádí na trh V3.1, sjednocuje V3 a R1 do hybridního modelu uvažování s postupným zvyšováním inteligence
Přírůstkové zvýšení inteligence: Počáteční výsledky benchmarkingu pro DeepSeek V3.1 ukazují index umělé analýzy 60 v režimu uvažování, což je nárůst oproti skóre R1 59. V režimu bez uvažování dosahuje verze V3.1 skóre 49, což je větší nárůst oproti dřívějšímu skóre V3 0324 44. To nechává V3.1 (uvažování) za nejnovějším Qwen3 235B 2507 (uvažování) - DeepSeek si nevzal zpět vedení.
Hybridní uvažování: @deepseek_ai poprvé přešla na hybridní model uvažování, který podporuje režimy uvažování i bez uvažování. Přechod společnosti DeepSeek na jednotný model hybridního uvažování napodobuje přístup společností OpenAI, Anthropic a Google. Je však zajímavé poznamenat, že Alibaba nedávno opustila svůj hybridní přístup, který upřednostňovala pro Qwen3 se svými samostatnými vydáními modelů uvažování a instrukcí Qwen3 2507.
Volání funkcí / použití nástroje: Zatímco DeepSeek tvrdí, že pro model je vylepšeno volání funkcí, DeepSeek V3.1 nepodporuje volání funkcí v režimu uvažování. To pravděpodobně podstatně omezí jeho schopnost podporovat agentské pracovní postupy s požadavky na inteligenci, včetně kódovacích agentů.
Použití tokenů: DeepSeek V3.1 má v režimu uvažování přírůstkově vyšší skóre než DeepSeek R1 a používá o něco méně tokenů napříč hodnoceními, která používáme pro Artificial Analysis Intelligence Index. V režimu nerozumu používá o něco více tokenů než V3 0324 - ale stále několikanásobně méně než ve svém vlastním režimu uvažování.
API: API první strany DeepSeek nyní poskytuje nový model DeepSeek V3.1 na svých koncových bodech chatu i uvažování – jednoduše změní, zda </think> je modelu v šabloně chatu poskytnut token koncového myšlení, aby bylo možné určit, zda bude model uvažovat.
Architektura: DeepSeek V3.1 je architektonicky identický s předchozími modely V3 a R1, s celkovými parametry 671B a aktivními parametry 37B.
Důsledky: Doporučujeme opatrnost při vytváření jakýchkoli předpokladů o tom, co toto vydání znamená o pokroku společnosti DeepSeek směrem k budoucímu modelu, který je v pověstech označován jako V4 nebo R2. Podotýkáme, že společnost DeepSeek již dříve vydala finální model postavený na jejich architektuře V2 10. prosince 2024, pouhé dva týdny před vydáním V3.


70,8K
Top
Hodnocení
Oblíbené