Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alors que Kimi k2 de Moonshot AI est le modèle non raisonneur à poids ouverts le plus performant dans l'Index d'Analyse Artificielle de l'Intelligence, il génère environ 3 fois plus de tokens que les autres modèles non raisonneurs, brouillant les frontières entre raisonnement et non raisonnement.
Kimi k2 est le plus grand modèle à poids ouverts majeur à ce jour - 1T de paramètres au total avec 32B actifs (cela nécessite une mémoire massive de 1 To en FP8 natif pour stocker les poids). Nous avons k2 à la 57e place dans l'Index d'Analyse Artificielle de l'Intelligence, un score impressionnant qui le place au-dessus de modèles comme GPT-4.1 et DeepSeek V3, mais derrière les modèles de raisonnement leaders.
Jusqu'à présent, il y avait une distinction claire entre les modèles de raisonnement et les modèles non raisonneurs dans nos évaluations - définie non seulement par le fait que le modèle utilise des balises <reasoning>, mais principalement par l'utilisation des tokens. Le nombre médian de tokens utilisés pour répondre à toutes les évaluations dans l'Index d'Analyse Artificielle de l'Intelligence est environ 10 fois plus élevé pour les modèles de raisonnement que pour les modèles non raisonneurs.
Le Kimi k2 de @Kimi_Moonshot utilise environ 3 fois le nombre de tokens que le modèle non raisonneur médian utilise. Son utilisation de tokens est seulement jusqu'à 30 % inférieure à celle de Claude 4 Sonnet et Opus lorsqu'ils sont exécutés en mode de réflexion étendu à budget maximum, et est presque triple de l'utilisation de tokens de Claude 4 Sonnet et Opus avec le raisonnement désactivé.
Nous recommandons donc que Kimi k2 soit comparé à Claude 4 Sonnet et Opus dans leurs modes de réflexion étendue à budget maximum, et non aux scores non raisonneurs pour les modèles Claude 4.
Kimi k2 est disponible sur l'API de première partie de @Kimi_Moonshot ainsi que sur @FireworksAI_HQ, @togethercompute, @novita_labs et @parasail_io.
Voir ci-dessous et sur l'Analyse Artificielle pour une analyse plus approfondie 👇



60,46K
Meilleurs
Classement
Favoris