DeepSeek запускає версію 3.1, об'єднуючи V3 і R1 у гібридну модель міркувань з поступовим зростанням інтелекту Поступове збільшення інтелекту: Початкові результати порівняльного аналізу для DeepSeek V3.1 показують, що індекс інтелекту штучного аналізу становить 60 балів у режимі міркувань, порівняно з результатом R1 у 59 балів. У режимі без міркувань V3.1 досягає 49 балів, що є більшим збільшенням порівняно з попереднім результатом V3 0324 у 44 балах. Це залишає V3.1 (міркування) позаду останнього Qwen3 235B 2507 від Alibaba (міркування) - DeepSeek не повернув собі лідерство. Гібридне міркування: @deepseek_ai вперше перейшов до гібридної моделі міркування, підтримуючи як режими міркування, так і способи неміркування. Перехід DeepSeek до єдиної гібридної моделі міркувань імітує підхід, прийнятий OpenAI, Anthropic і Google. Цікаво, однак, відзначити, що Alibaba нещодавно відмовилася від свого гібридного підходу, якому вони віддали перевагу для Qwen3, випустивши окремі випуски моделей міркувань та інструкцій Qwen3 2507. Виклик функцій / використання інструменту: У той час як DeepSeek заявляє про покращений виклик функцій для моделі, DeepSeek V3.1 не підтримує виклик функцій у режимі міркування. Це, ймовірно, суттєво обмежить його здатність підтримувати агентські робочі процеси з вимогами до інтелекту, у тому числі в агентах кодування. Використання токенів: DeepSeek V3.1 отримує поступово вищі бали в режимі міркувань, ніж DeepSeek R1, і використовує трохи менше токенів у всіх показниках, які ми використовуємо для індексу інтелекту штучного аналізу. У режимі без міркувань він використовує трохи більше токенів, ніж V3 0324 - але все одно в кілька разів менше, ніж у власному режимі міркування. API: Перший сторонній API DeepSeek тепер обслуговує нову модель DeepSeek V3.1 як на їхніх кінцевих точках чату, так і на кінцевих точках міркувань - просто змінюючи, чи надається токен кінцевого мислення </think> моделі в шаблоні чату, щоб контролювати, чи буде модель міркувати. Архітектура: DeepSeek V3.1 архітектурно ідентична попереднім моделям V3 і R1, із загальними параметрами 671B і 37B активними параметрами. Наслідки: Ми б радили з обережністю робити будь-які припущення про те, що цей реліз означає про прогрес DeepSeek у напрямку майбутньої моделі, яку в чутках називають V4 або R2. Зазначимо, що раніше DeepSeek випустила фінальну модель, побудовану на їхній архітектурі V2, 10 грудня 2024 року, всього за два тижні до релізу V3.
70,78K