🚀 Tensorplex Dojo (Subnet 52) beraksi! Temui DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, disesuaikan dengan kumpulan data Dojo untuk membuat UI front-end yang menakjubkan! ✨ Menghasilkan antarmuka yang indah dan interaktif ✨ Dilatih tentang data sintetis dengan umpan balik manusia yang terdistribusi ✨ Didukung oleh (Subnet 52) di Bittensor 👇
Begini cara kerjanya: - Validator di jaringan Dojo menghasilkan output UI yang beragam menggunakan model AI tingkat lanjut. - Evaluator manusia (penambang) menilai UI ini berdasarkan estetika, interaktivitas, dan keselarasan dengan tugas yang dimaksudkan. - Umpan balik dikumpulkan ke dalam kumpulan data khusus (SFT dan DPO) untuk lebih meningkatkan pelatihan. 2/8
Awalnya, Qwen2.5-Coder-7B-Instruct berjuang secara signifikan dalam menghasilkan kode UI lengkap. Kami secara signifikan meningkatkan kemampuannya dengan melatihnya pada kumpulan data SFT penyelesaian 25 ribu berkualitas tinggi kami, mengubahnya menjadi generator antarmuka terstruktur yang andal. 3/8
Menambahkan himpunan data DPO penyelesaian 12,5 ribu yang dievaluasi oleh kontributor manusia secara signifikan meningkatkan keselarasan UI dengan preferensi pengguna nyata. Model yang dilatih DPO jelas mengungguli versi SFT dalam evaluasi manusia. 4/8
Anehnya, human-driven training (DPO) juga meningkatkan kinerja pada tolok ukur pengkodean umum seperti HumanEval dan MBPP, meskipun pelatihan hanya berfokus pada tugas UI. 5/8
Kasus penggunaan potensial untuk DOJO-INTERFACE-CODER-7B: - Antarmuka pendidikan adaptif - Alat penjurnalan yang dapat disesuaikan yang berpusat pada privasi - UI dinamis untuk kolaborasi manusia-AI yang ditingkatkan 6/8
Langkah selanjutnya untuk Jaringan Dojo: - Memperluas lingkaran umpan balik manusia kami untuk pengumpulan data yang lebih kaya - Mengembangkan antarmuka manusia-agen yang dinamis - Membangun kemitraan strategis di berbagai industri 7/8
9,91K