Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
В то время как Kimi k2 от Moonshot AI является ведущей моделью без рассуждений с открытыми весами в индексе искусственного интеллекта, она выводит в ~3 раза больше токенов, чем другие неразумные модели, стирая границы между рассуждениями и нерассуждениями
Kimi k2 - самая большая модель с открытыми весами - 1 Тл общих параметров при 32 Б активных (для этого требуется огромный 1 ТБ памяти на родной FP8 для удержания весов). У нас k2 на 57 месте в индексе искусственного интеллекта, впечатляющий результат, который ставит его выше таких моделей, как GPT-4.1 и DeepSeek V3, но отстает от ведущих моделей рассуждений.
До сих пор существовало четкое различие между разумной и неразумной моделями в наших оценках, определяемое не только тем <reasoning> , использует ли модель теги, но в первую очередь использованием токенов. Медианное количество токенов, используемых для ответа на все оценки в индексе искусственного интеллекта, в ~10 раз выше для разумных моделей, чем для неразумных моделей.
Kimi k2 @Kimi_Moonshot использует в ~3 раза больше токенов, чем медианная необоснованная модель. Его использование токенов всего на 30% ниже, чем у Claude 4 Sonnet и Opus при запуске в режиме расширенного мышления с максимальным бюджетом, и почти в три раза выше, чем у Claude 4 Sonnet и Opus с отключенным рассуждением.
Поэтому мы рекомендуем сравнивать Kimi k2 с Claude 4 Sonnet и Opus в их максимально бюджетных расширенных режимах мышления, а не с необоснованными оценками моделей Claude 4.
Kimi k2 доступен в собственном API @Kimi_Moonshot, а также в @FireworksAI_HQ, @togethercompute, @novita_labs и @parasail_io.
Смотрите ниже и на Искусственный анализ для дальнейшего анализа 👇



60,62K
Топ
Рейтинг
Избранное