🚀 Tensorplex Dojo (Subnet 52) în acțiune! Faceți cunoștință cu DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, reglat fin cu seturi de date Dojo pentru a crea interfețe de utilizare uimitoare pentru front-end! ✨ Generează interfețe frumoase, interactive ✨ Antrenat pe date sintetice cu feedback uman distribuit ✨ Realizat de (Subrețeaua 52) pe Bittensor 👇
Iată cum funcționează: - Validatorii din rețeaua Dojo generează diverse ieșiri UI folosind modele AI avansate. - Evaluatorii umani (minerii) evaluează aceste interfețe de utilizare în funcție de estetică, interactivitate și aliniere cu sarcina dorită. - Feedback-ul este colectat în seturi de date specializate (SFT și DPO) pentru a îmbunătăți și mai mult instruirea. 2/8
Inițial, Qwen2.5-Coder-7B-Instruct s-a luptat semnificativ cu generarea codului complet al interfeței de utilizare. I-am îmbunătățit semnificativ capacitățile antrenându-l pe setul nostru de date SFT de înaltă calitate de 25k, transformându-l într-un generator de interfață fiabil și structurat. 3/8
Adăugarea unui set de date DPO cu 12,5k de completări evaluate de contribuitori umani a îmbunătățit semnificativ alinierea UI cu preferințele reale ale utilizatorilor. Modelul antrenat de DPO a depășit în mod clar versiunea SFT în evaluările umane. 4/8
În mod surprinzător, instruirea condusă de oameni (DPO) a crescut, de asemenea, performanța la benchmark-urile generale de codare, cum ar fi HumanEval și MBPP, chiar dacă instruirea s-a concentrat exclusiv pe sarcinile UI. 5/8
Cazuri potențiale de utilizare pentru DOJO-INTERFACE-CODER-7B: - Interfețe educaționale adaptive - Instrumente de jurnalizare personalizabile centrate pe confidențialitate - Interfețe de utilizare dinamice pentru o colaborare îmbunătățită om-AI 6/8
Pașii următori pentru Dojo Network: - Extinderea buclei noastre de feedback uman pentru o colectare mai bogată a datelor - Dezvoltarea interfețelor dinamice om-agent - Construirea de parteneriate strategice în diverse industrii 7/8
9,91K