Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Si bien Kimi k2 de Moonshot AI es el modelo líder de no razonamiento de pesos abiertos en el Índice de Inteligencia de Análisis Artificial, produce ~ 3 veces más tokens que otros modelos sin razonamiento, difuminando las líneas entre el razonamiento y el no razonamiento
Kimi k2 es el modelo de pesos abiertos más grande hasta el momento: parámetros totales de 1T con 32B activos (esto requiere 1 TB de memoria en FP8 nativo para mantener los pesos). Tenemos a k2 en el puesto 57 en el Índice de Inteligencia de Análisis Artificial, una puntuación impresionante que lo sitúa por encima de modelos como GPT-4.1 y DeepSeek V3, pero por detrás de los principales modelos de razonamiento.
Hasta ahora, ha habido una clara distinción entre el modelo de razonamiento y los modelos no razonadores en nuestras evaluaciones, definida no solo por si el modelo usa <reasoning> etiquetas, sino principalmente por el uso de tokens. El número medio de tokens utilizados para responder a todas las evaluaciones en el Índice de Inteligencia de Análisis Artificial es ~ 10 veces mayor para los modelos de razonamiento que para los modelos sin razonamiento.
Kimi k2 de @Kimi_Moonshot usa ~ 3 veces la cantidad de tokens que usa el modelo medio de no razonamiento. Su uso de tokens es solo hasta un 30% más bajo que Claude 4 Sonnet y Opus cuando se ejecuta en su modo de pensamiento extendido de presupuesto máximo, y es casi el triple del uso de tokens tanto Claude 4 Sonnet como Opus con el razonamiento desactivado.
Por lo tanto, recomendamos que Kimi k2 se compare con Claude 4 Sonnet y Opus en sus modos de pensamiento extendido de presupuesto máximo, no con las puntuaciones no racionales de los modelos Claude 4.
Kimi k2 está disponible en la API propia de @Kimi_Moonshot, así como en @FireworksAI_HQ, @togethercompute, @novita_labs y @parasail_io.
Consulte a continuación y en Análisis artificial para un análisis 👇 más detallado



60.46K
Populares
Ranking
Favoritas