DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Alors que Kimi k2 de Moonshot AI est le modèle non raisonneur à poids ouverts le plus performant dans l'Index d'Analyse Artificielle de l'Intelligence, il génère environ 3 fois plus de tokens que les autres modèles non raisonneurs, brouillant les frontières entre raisonnement et non raisonnement. Kimi k2 est le plus grand modèle à poids ouverts majeur à ce jour - 1T de paramètres au total avec 32B actifs (cela nécessite une mémoire massive de 1 To en FP8 natif pour stocker les poids). Nous avons k2 à la 57e place dans l'Index d'Analyse Artificielle de l'Intelligence, un score impressionnant qui le place au-dessus de modèles comme GPT-4.1 et DeepSeek V3, mais derrière les modèles de raisonnement leaders. Jusqu'à présent, il y avait une distinction claire entre les modèles de raisonnement et les modèles non raisonneurs dans nos évaluations - définie non seulement par le fait que le modèle utilise des balises <reasoning>, mais principalement par l'utilisation des tokens. Le nombre médian de tokens utilisés pour répondre à toutes les évaluations dans l'Index d'Analyse Artificielle de l'Intelligence est environ 10 fois plus élevé pour les modèles de raisonnement que pour les modèles non raisonneurs. Le Kimi k2 de @Kimi_Moonshot utilise environ 3 fois le nombre de tokens que le modèle non raisonneur médian utilise. Son utilisation de tokens est seulement jusqu'à 30 % inférieure à celle de Claude 4 Sonnet et Opus lorsqu'ils sont exécutés en mode de réflexion étendu à budget maximum, et est presque triple de l'utilisation de tokens de Claude 4 Sonnet et Opus avec le raisonnement désactivé. Nous recommandons donc que Kimi k2 soit comparé à Claude 4 Sonnet et Opus dans leurs modes de réflexion étendue à budget maximum, et non aux scores non raisonneurs pour les modèles Claude 4. Kimi k2 est disponible sur l'API de première partie de @Kimi_Moonshot ainsi que sur @FireworksAI_HQ, @togethercompute, @novita_labs et @parasail_io. Voir ci-dessous et sur l'Analyse Artificielle pour une analyse plus approfondie 👇

60,46K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables