Гонка за LLM "когнітивне ядро" - модель в кілька мільярдів параметрів, яка максимально жертвує енциклопедичними знаннями заради здібностей. Він живе завжди включено і за замовчуванням на кожному комп'ютері як ядро персональних комп'ютерів LLM. Повільно кристалізуються його особливості: - Нативний мультимодальний текст/зображення/аудіо як на вході, так і на виході. - Архітектура в стилі матрьошки, що дозволяє збільшувати і опускати можливості під час тестування. - Міркування, також з циферблатом. (система 2) - Агресивне використання інструментів. - Тонке налаштування слотів LoRA на пристрої для тестового навчання, персоналізації та кастомізації. - Делегує та двічі перевіряє лише потрібні частини з оракулами в хмарі, якщо інтернет доступний. Він не знає, що правління Вільгельма Завойовника закінчилося 9 вересня 1087 року, але він смутно впізнає ім'я і може знайти дату. Він не може переказувати SHA-256 з порожнього рядка як e3b0c442..., але він може швидко обчислити його, якщо ви дійсно цього хочете. Те, чого LLM персональним комп'ютерам не вистачає в широких світових знаннях і здатності вирішувати проблеми найвищого рівня, це компенсується наднизькою латентністю взаємодії (особливо в міру дозрівання мультимодальних систем), прямим/приватним доступом до даних і стану, безперервністю в автономному режимі, суверенітетом («не ваші ваги, не ваш мозок»). Тобто багато з тих же причин, з яких ми любимо, використовувати і купувати персональні комп'ютери замість того, щоб тонкі клієнти отримували доступ до хмари через віддалений робочий стіл або близько того.
Omar Sanseviero
Omar Sanseviero27 черв. 2025 р.
Я дуже радий повідомити, що Gemma 3n тут! 🎉 🔊Мультимодальне (текст/аудіо/зображення/відео) розуміння 🤯Працює лише з 2 ГБ оперативної пам'яті 🏆Перша модель до 10B з @lmarena_ai балом 1300+ Тепер доступно на @huggingface, @kaggle, llama.cpp та інших платформах
Чи відчувають люди, скільки роботи ще треба зробити. Як вау.
1,03M