🚀 Tensorplex Dojo (Subnet 52) w akcji! Poznaj DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, dostosowany z zestawów danych Dojo, aby tworzyć oszałamiające interfejsy front-end! ✨ Generuje piękne, interaktywne interfejsy ✨ Szkolony na syntetycznych danych z rozproszonymi opiniami ludzi ✨ Zasilany przez (Subnet 52) na Bittensor 👇
Oto jak to działa: - Walidatorzy w sieci Dojo generują różnorodne wyjścia UI przy użyciu zaawansowanych modeli AI. - Ludzie oceniający (górnicy) oceniają te interfejsy użytkownika na podstawie estetyki, interaktywności i zgodności z zamierzonym zadaniem. - Opinie są zbierane w specjalistycznych zbiorach danych (SFT i DPO), aby dalej poprawić szkolenie. 2/8
Początkowo, Qwen2.5-Coder-7B-Instruct miał znaczne trudności z generowaniem pełnego kodu UI. Znacząco poprawiliśmy jego możliwości, szkoląc go na naszym wysokiej jakości zbiorze danych SFT z 25 tysiącami zakończeń, przekształcając go w niezawodny, strukturalny generator interfejsów. 3/8
Dodanie zestawu danych DPO o 12,5 tys. zakończenia, ocenianego przez ludzkich współpracowników, znacznie poprawiło zgodność interfejsu użytkownika z rzeczywistymi preferencjami użytkowników. Model wytrenowany na DPO wyraźnie przewyższył wersję SFT w ocenach ludzkich. 4/8
Zaskakująco, szkolenie prowadzone przez ludzi (DPO) również poprawiło wyniki w ogólnych benchmarkach kodowania, takich jak HumanEval i MBPP, mimo że szkolenie koncentrowało się wyłącznie na zadaniach UI. 5/8
Potencjalne zastosowania dla DOJO-INTERFACE-CODER-7B: - Adaptacyjne interfejsy edukacyjne - Narzędzia do dziennikowania z naciskiem na prywatność i możliwość dostosowania - Dynamiczne interfejsy użytkownika dla lepszej współpracy człowiek-AI 6/8
Kolejne kroki dla Dojo Network: - Rozszerzenie naszej pętli informacji zwrotnej od ludzi w celu zbierania bogatszych danych - Opracowanie dynamicznych interfejsów człowiek-agent - Budowanie strategicznych partnerstw w różnych branżach 7/8
9,9K