Moonshot AIのKimi k2は、Artificial Analysis Intelligence Indexの主要なオープンウェイト非推論モデルですが、他の非推論モデルよりも~3倍多くのトークンを出力し、推論と非推論の境界線を曖昧にしています Kimi k2は、これまでで最大の主要なオープンウェイトモデルであり、合計パラメータが1Tで、32Bがアクティブです(これは、ウェイトを保持するためにネイティブFP8で1TBの大量のメモリが必要です)。Artificial Analysis Intelligence Indexではk2が57で、GPT-4.1やDeepSeek V3などのモデルよりも優れたスコアですが、主要な推論モデルには遅れをとっています。 これまで、私たちの評価では、推論モデルと非推論モデルの間に明確な区別がありました - モデルがタグを使用するかどうかだけでなく<reasoning>、主にトークンの使用によって定義されます。Artificial Analysis Intelligence Index のすべての評価に回答するために使用されるトークンの数の中央値は、推論モデルの方が非推論モデルよりも ~10 倍高くなっています。 @Kimi_MoonshotのKimi k2は、中央値の非推論モデルが使用するトークンの数の~3倍を使用します。そのトークン使用量は、最大予算の拡張思考モードで実行すると、Claude 4 SonnetおよびOpusよりも最大30%低いだけで、推論をオフにした場合のClaude 4 SonnetおよびOpusの両方のトークン使用量のほぼ3倍です。 したがって、Kimi k2 は、Claude 4 モデルの非推論スコアではなく、最大予算の拡張思考モードで Claude 4 Sonnet および Opus と比較することをお勧めします。 Kimi k2 は、@Kimi_Moonshot のファーストパーティ API のほか、@FireworksAI_HQ、@togethercompute、@novita_labs、@parasail_io で利用できます。 詳細な分析👇については、以下とArtificial Analysisを参照してください
60.46K