DeepSeekがV3.1を発表し、V3とR1をハイブリッド推論モデルに統合し、インテリジェンスを段階的に向上させる インテリジェンスの増加: DeepSeek V3.1 の初期ベンチマーク結果では、推論モードでの人工分析知能指数は R1 のスコア 59 から 60 に上昇しました。非推論モードでは、V3.1 は 49 のスコアを達成し、以前の V3 0324 スコアの 44 から大幅に増加しています。これにより、V3.1 (推論) はアリババの最新の Qwen3 235B 2507 (推論) に遅れをとっています - DeepSeek はリードを取り戻していません。 ハイブリッド推論: @deepseek_ai は初めてハイブリッド推論モデルに移行し、推論モードと非推論モードの両方をサポートします。DeepSeek の統合ハイブリッド推論モデルへの移行は、OpenAI、Anthropic、Google が採用したアプローチを模倣しています。ただし、興味深いことに、アリババは最近、Qwen3 2507推論モデルと指示モデルを個別にリリースし、Qwen3に好まれたハイブリッドアプローチを放棄しました。 関数呼び出し/ツールの使用: DeepSeek はモデルの関数呼び出しが改善されたと主張していますが、DeepSeek V3.1 は推論モード時の関数呼び出しをサポートしていません。これにより、エージェントのコーディングを含め、インテリジェンス要件を持つエージェントワークフローをサポートする能力が大幅に制限される可能性があります。 トークンの使用状況: DeepSeek V3.1 は、推論モードで DeepSeek R1 よりもスコアが徐々に高く、人工分析知能インデックスに使用する評価全体で使用するトークンの数がわずかに少なくなります。非推論モードでは、V3 0324 よりもわずかに多くのトークンを使用しますが、それでも独自の推論モードよりも数倍少ないです。 API: DeepSeekのファーストパーティAPIは、チャットエンドポイントと推論エンドポイントの両方で新しいDeepSeek V3.1モデルを提供するようになりました - </think> チャットテンプレートで最終思考トークンがモデルに提供されるかどうかを変更して、モデルが推論するかどうかを制御するだけです。 アーキテクチャ: DeepSeek V3.1 は、以前の V3 および R1 モデルとアーキテクチャ的に同一で、合計パラメータは 671B で、アクティブ パラメータは 37B です。 含意: このリリースが、噂では V4 または R2 と呼ばれる将来のモデルに向けた DeepSeek の進歩について何を意味するかについて仮定を立てる際には注意することをお勧めします。DeepSeek は以前、V3 リリースのわずか 2 週間前の 2024 年 12 月 10 日に V2 アーキテクチャに基づいて構築された最終モデルをリリースしていたことに注意してください。
70.79K