DeepSeek startet V3.1 und vereint V3 und R1 in ein hybrides Denkmodell mit einem schrittweisen Anstieg der Intelligenz Schrittweiser Anstieg der Intelligenz: Erste Benchmarking-Ergebnisse für DeepSeek V3.1 zeigen einen Artificial Analysis Intelligence Index von 60 im Denkmodus, gegenüber einem Wert von 59 für R1. Im Nicht-Denkmodus erreicht V3.1 einen Wert von 49, was einen größeren Anstieg gegenüber dem früheren V3 0324-Wert von 44 darstellt. Damit bleibt V3.1 (Denkmodus) hinter Alibabas neuestem Qwen3 235B 2507 (Denkmodus) zurück - DeepSeek hat die Führung nicht zurückerobert. Hybrides Denken: @deepseek_ai hat zum ersten Mal ein hybrides Denkmodell eingeführt - das sowohl Denk- als auch Nicht-Denkmodi unterstützt. Der Schritt von DeepSeek zu einem einheitlichen hybriden Denkmodell ahmt den Ansatz von OpenAI, Anthropic und Google nach. Es ist jedoch interessant zu bemerken, dass Alibaba kürzlich ihren hybriden Ansatz, den sie für Qwen3 bevorzugten, mit den separaten Veröffentlichungen von Qwen3 2507 Denk- und Instruktionsmodellen aufgegeben hat. Funktionsaufrufe / Werkzeugnutzung: Während DeepSeek eine verbesserte Funktionsaufrufunterstützung für das Modell beansprucht, unterstützt DeepSeek V3.1 keine Funktionsaufrufe im Denkmodus. Dies wird wahrscheinlich die Fähigkeit erheblich einschränken, agentische Workflows mit Intelligenzanforderungen zu unterstützen, einschließlich in Codierungsagenten. Token-Nutzung: DeepSeek V3.1 erzielt im Denkmodus schrittweise höhere Werte als DeepSeek R1 und verwendet in den Bewertungen, die wir für den Artificial Analysis Intelligence Index verwenden, leicht weniger Tokens. Im Nicht-Denkmodus verwendet es leicht mehr Tokens als V3 0324 - aber immer noch mehrere Male weniger als im eigenen Denkmodus. API: Die First-Party-API von DeepSeek bedient jetzt das neue DeepSeek V3.1-Modell sowohl an ihren Chat- als auch an den Denk-Endpunkten - indem einfach geändert wird, ob das End-Denk-</think>-Token im Chat-Template an das Modell übergeben wird, um zu steuern, ob das Modell denken wird. Architektur: DeepSeek V3.1 ist architektonisch identisch mit den vorherigen V3- und R1-Modellen, mit insgesamt 671B Parametern und 37B aktiven Parametern. Implikationen: Wir würden raten, vorsichtig zu sein, wenn es darum geht, Annahmen darüber zu treffen, was diese Veröffentlichung über DeepSeeks Fortschritte in Richtung eines zukünftigen Modells, das in Gerüchten als V4 oder R2 bezeichnet wird, impliziert. Wir stellen fest, dass DeepSeek zuvor das endgültige Modell, das auf ihrer V2-Architektur basierte, am 10. Dezember 2024 veröffentlicht hat, nur zwei Wochen bevor V3 veröffentlicht wurde.
70,79K