DeepSeek lanceert V3.1, die V3 en R1 verenigt in een hybride redeneermodel met een incrementele toename in intelligentie Incrementele toename in intelligentie: De eerste benchmarkresultaten voor DeepSeek V3.1 tonen een Artificial Analysis Intelligence Index van 60 in redeneermodus, een stijging ten opzichte van de score van 59 van R1. In niet-redeneermodus behaalt V3.1 een score van 49, een grotere stijging ten opzichte van de eerdere V3 0324 score van 44. Dit laat V3.1 (redenerend) achter bij Alibaba's nieuwste Qwen3 235B 2507 (redenerend) - DeepSeek heeft de leiding niet teruggenomen. Hybride redenering: @deepseek_ai is voor het eerst overgestapt op een hybride redeneermodel - dat zowel redenerende als niet-redenerende modi ondersteunt. DeepSeek's overstap naar een verenigd hybride redeneermodel imiteert de aanpak van OpenAI, Anthropic en Google. Het is echter interessant op te merken dat Alibaba onlangs hun hybride aanpak, die ze voor Qwen3 favoriseerden, heeft verlaten met hun aparte releases van Qwen3 2507 redenerings- en instructiemodellen. Functieaanroep / toolgebruik: Hoewel DeepSeek verbeterde functieaanroepen voor het model claimt, ondersteunt DeepSeek V3.1 geen functieaanroepen in redeneermodus. Dit zal waarschijnlijk de mogelijkheid om agentische workflows met intelligentie-eisen te ondersteunen, aanzienlijk beperken, inclusief in coderingsagenten. Tokengebruik: DeepSeek V3.1 scoort incrementeel hoger in redeneermodus dan DeepSeek R1, en gebruikt iets minder tokens in de evaluaties die we gebruiken voor de Artificial Analysis Intelligence Index. In niet-redeneermodus gebruikt het iets meer tokens dan V3 0324 - maar nog steeds meerdere keren minder dan in zijn eigen redeneermodus. API: DeepSeek's eerste partij API bedient nu het nieuwe DeepSeek V3.1 model op zowel hun chat- als redeneereindpunten - simpelweg door te veranderen of de einddenkende </think> token aan het model in de chattemplate wordt gegeven om te controleren of het model zal redeneren. Architectuur: DeepSeek V3.1 is architectonisch identiek aan de eerdere V3 en R1 modellen, met 671B totale parameters en 37B actieve parameters. Gevolgen: We zouden voorzichtig zijn met het maken van aannames over wat deze release impliceert over DeepSeek's vooruitgang naar een toekomstig model dat in geruchten V4 of R2 wordt genoemd. We merken op dat DeepSeek eerder het laatste model dat is gebouwd op hun V2-architectuur op 10 december 2024 heeft vrijgegeven, slechts twee weken voordat ze V3 uitbrachten.
70,8K