В то время как Kimi k2 от Moonshot AI является ведущей моделью без рассуждений с открытыми весами в индексе искусственного интеллекта, она выводит в ~3 раза больше токенов, чем другие неразумные модели, стирая границы между рассуждениями и нерассуждениями Kimi k2 - самая большая модель с открытыми весами - 1 Тл общих параметров при 32 Б активных (для этого требуется огромный 1 ТБ памяти на родной FP8 для удержания весов). У нас k2 на 57 месте в индексе искусственного интеллекта, впечатляющий результат, который ставит его выше таких моделей, как GPT-4.1 и DeepSeek V3, но отстает от ведущих моделей рассуждений. До сих пор существовало четкое различие между разумной и неразумной моделями в наших оценках, определяемое не только тем <reasoning> , использует ли модель теги, но в первую очередь использованием токенов. Медианное количество токенов, используемых для ответа на все оценки в индексе искусственного интеллекта, в ~10 раз выше для разумных моделей, чем для неразумных моделей. Kimi k2 @Kimi_Moonshot использует в ~3 раза больше токенов, чем медианная необоснованная модель. Его использование токенов всего на 30% ниже, чем у Claude 4 Sonnet и Opus при запуске в режиме расширенного мышления с максимальным бюджетом, и почти в три раза выше, чем у Claude 4 Sonnet и Opus с отключенным рассуждением. Поэтому мы рекомендуем сравнивать Kimi k2 с Claude 4 Sonnet и Opus в их максимально бюджетных расширенных режимах мышления, а не с необоснованными оценками моделей Claude 4. Kimi k2 доступен в собственном API @Kimi_Moonshot, а также в @FireworksAI_HQ, @togethercompute, @novita_labs и @parasail_io. Смотрите ниже и на Искусственный анализ для дальнейшего анализа 👇
60,62K