Si bien Kimi k2 de Moonshot AI es el modelo de no razonamiento de ponderaciones abiertas líder en el Índice de Inteligencia de Análisis Artificial, produce ~ 3 veces más tokens que otros modelos sin razonamiento, difuminando las líneas entre razonamiento y no razonamiento Kimi k2 es el modelo de pesas abiertas más grande hasta el momento: parámetros totales de 1T con 32B activos (esto requiere un enorme 1TB de memoria en FP8 nativo para sostener los pesos). Tenemos k2 en 57 en el Índice de Inteligencia de Análisis Artificial, una puntuación impresionante que lo coloca por encima de modelos como GPT-4.1 y DeepSeek V3, pero detrás de los principales modelos de razonamiento. Hasta ahora, ha habido una clara distinción entre el modelo de razonamiento y los modelos no racionales en nuestras evaluaciones, definidas no solo por si el modelo usa <reasoning> etiquetas, sino principalmente por el uso de tokens. El número medio de tokens utilizados para responder a todas las evaluaciones en el Índice de Inteligencia de Análisis Artificial es ~10 veces mayor para los modelos de razonamiento que para los modelos sin razonamiento. Kimi k2 de @Kimi_Moonshot usa ~ 3 veces la cantidad de tokens que usa el modelo medio sin razonamiento. Su uso de tokens es solo hasta un 30% más bajo que Claude 4 Sonnet y Opus cuando se ejecuta en su modo de pensamiento extendido de presupuesto máximo, y es casi el triple del uso de tokens de Claude 4 Sonnet y Opus con el razonamiento desactivado. Por lo tanto, recomendamos que Kimi k2 se compare con Claude 4 Sonnet y Opus en sus modos de pensamiento extendido de presupuesto máximo, no con las partituras no razonadas de los modelos Claude 4. Kimi k2 está disponible en la API propia de @Kimi_Moonshot, así como en @FireworksAI_HQ, @togethercompute, @novita_labs y @parasail_io. Consulte a continuación y en Análisis artificial para obtener más información sobre el análisis 👇
60,61K