🚀 Tensorplex Dojo (Subnet 52) i aktion! Det här är DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruera, finjustera med Dojo-datauppsättningar för att skapa fantastiska gränssnittsgränssnitt på frontend! ✨ Genererar vackra, interaktiva gränssnitt ✨ Tränad på syntetisk data med distribuerad mänsklig feedback ✨ Drivs av (Subnet 52) på Bittensor 👇
Så här fungerar det: - Validerare på Dojo-nätverket genererar olika UI-utdata med hjälp av avancerade AI-modeller. - Mänskliga utvärderare (miners) betygsätter dessa användargränssnitt baserat på estetik, interaktivitet och anpassning till den avsedda uppgiften. - Feedback samlas in i specialiserade datauppsättningar (SFT och DPO) för att ytterligare förbättra utbildningen. 2/8
Till en början hade Qwen2.5-Coder-7B-Instruct stora problem med att generera fullständig användargränssnittskod. Vi förbättrade dess kapacitet avsevärt genom att träna den på vår högkvalitativa 25k-completion SFT-datauppsättning, vilket gjorde den till en pålitlig, strukturerad gränssnittsgenerator. 3/8
Genom att lägga till en DPO-datauppsättning med 12,5 k-slutförande som utvärderades av mänskliga bidragsgivare förbättrades användargränssnittets anpassning avsevärt till verkliga användarpreferenser. Den DPO-tränade modellen överträffade klart SFT-versionen i mänskliga utvärderingar. 4/8
Överraskande nog ökade Human Driven Training (DPO) också prestandan på allmänna kodningsriktmärken som HumanEval och MBPP, även om utbildningen enbart fokuserade på UI-uppgifter. 5/8
Potentiella användningsområden för DOJO-INTERFACE-CODER-7B: - Adaptiva utbildningsgränssnitt - Integritetscentrerade anpassningsbara journalföringsverktyg - Dynamiska användargränssnitt för förbättrat samarbete mellan människa och AI 6/8
Nästa steg för Dojo Network: - Utöka vår mänskliga feedbackloop för rikare datainsamling - Utveckling av dynamiska gränssnitt mellan människa och agent - Bygga strategiska partnerskap inom olika branscher 7/8
9,92K