🚀 Tensorplex Dojo (Підмережа 52) в дії! Зустрічайте DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, точно налаштований за допомогою наборів даних Dojo для створення приголомшливих інтерфейсів інтерфейсу! ✨ Генерує красиві, інтерактивні інтерфейси ✨ Навчання на синтетичних даних з розподіленим зворотним зв'язком ✨ Працює на (підмережа 52) на Bittensor 👇
Ось як це працює: - Валідатори в мережі Dojo генерують різноманітні виходи інтерфейсу користувача, використовуючи передові моделі штучного інтелекту. - Люди-оцінювачі (майнери) оцінюють ці інтерфейси на основі естетики, інтерактивності та відповідності наміченому завданню. - Зворотний зв'язок збирається в спеціалізовані набори даних (SFT і DPO) для подальшого вдосконалення навчання. 2/8
Спочатку Qwen2.5-Coder-7B-Instruct мав значні труднощі зі створенням повного UI-коду. Ми значно покращили його можливості, навчивши його на нашому високоякісному наборі даних SFT з 25 тисячами завершення, перетворивши його на надійний, структурований генератор інтерфейсів. 3/8
Додавання набору даних DPO з доповненням 12,5 тис., оціненого людьми-учасниками, значно покращило узгодження інтерфейсу користувача з реальними уподобаннями користувача. Модель, навчена DPO, явно перевершила версію SFT в оцінках на людях. 4/8
Дивно, але людське навчання (DPO) також підвищило продуктивність на загальних тестах кодування, таких як HumanEval і MBPP, навіть незважаючи на те, що навчання було зосереджено виключно на завданнях інтерфейсу користувача. 5/8
Потенційні варіанти використання DOJO-INTERFACE-CODER-7B: - Адаптивні освітні інтерфейси - Налаштовувані інструменти ведення журналу, орієнтовані на конфіденційність - Динамічні інтерфейси для кращої співпраці людини та штучного інтелекту 6/8
Подальші кроки для Dojo Network: - Розширення нашого циклу зворотного зв'язку з людьми для більш детального збору даних - Розробка динамічних інтерфейсів людина-агент - Побудова стратегічного партнерства в різних галузях 7/8
9,9K