У той час як Kimi k2 від Moonshot AI є провідною моделлю без міркувань з відкритими вагами в Індексі інтелекту штучного аналізу, вона видає в ~3 рази більше токенів, ніж інші моделі без міркувань, розмиваючи межі між міркуванням і неміркуванням Kimi k2 є найбільшою великою моделлю з відкритими вагами на сьогоднішній день - загальні параметри 1T з активними 32B (для цього потрібен масивний 1 ТБ пам'яті при рідному FP8, щоб утримувати гирі). Ми маємо k2 на 57 місці в Artificial Analysis Intelligence Index, вражаючий результат, який ставить його вище таких моделей, як GPT-4.1 і DeepSeek V3, але відстає від провідних моделей міркувань. До теперішнього часу в наших дослідженнях існувало чітке розмежування між моделлю міркування і неміркуючими моделями - визначається не тільки тим, чи використовує модель <reasoning> теги, але в першу чергу використанням токенів. Медіанна кількість токенів, що використовуються для відповіді на всі запитання в індексі інтелекту штучного аналізу, ~10 разів вища для моделей міркування, ніж для моделей без міркування. Kimi k2 @Kimi_Moonshot використовує в ~3 рази більше токенів, ніж використовує медіанна модель без міркувань. Його використання токенів лише на 30% нижче, ніж у Claude 4 Sonnet і Opus, коли вони працюють у режимі розширеного мислення з максимальним бюджетом, і майже втричі перевищує використання токенів як Claude 4 Sonnet, так і Opus з вимкненими міркуваннями. Тому ми рекомендуємо порівнювати Kimi k2 з Claude 4 Sonnet і Opus в їх максимально бюджетних режимах розширеного мислення, а не з оцінками без обґрунтувань для моделей Claude 4. Kimi k2 доступний на власному API @Kimi_Moonshot, а також @FireworksAI_HQ, @togethercompute, @novita_labs та @parasail_io. Дивіться нижче та на Штучний аналіз для подальшого аналізу 👇
60,47K