🚀 Tensorplex Dojo (Subnet 52) i aksjon! Møt DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, finjustert med Dojo-datasett for å lage fantastiske front-end-grensesnitt! ✨ Genererer vakre, interaktive grensesnitt ✨ Opplært på syntetiske data med distribuert menneskelig tilbakemelding ✨ Drevet av (Subnet 52) på Bittensor 👇
Slik fungerer det: - Validatorer på Dojo-nettverket genererer ulike UI-utganger ved hjelp av avanserte AI-modeller. - Menneskelige evaluatorer (gruvearbeidere) vurderer disse brukergrensesnittene basert på estetikk, interaktivitet og tilpasning til den tiltenkte oppgaven. - Tilbakemeldinger samles inn i spesialiserte datasett (SFT og DPO) for å forbedre opplæringen ytterligere. 2/8
Til å begynne med slet Qwen2.5-Coder-7B-Instruct betydelig med å generere fullstendig UI-kode. Vi forbedret funksjonene betydelig ved å trene det på vårt høykvalitets SFT-datasett med 25k-fullføring, og gjøre det til en pålitelig, strukturert grensesnittgenerator. 3/8
Å legge til et DPO-datasett med 12.5k fullføring evaluert av menneskelige bidragsytere forbedret UI-justeringen betydelig med reelle brukerpreferanser. Den DPO-trente modellen overgikk klart SFT-versjonen i menneskelige evalueringer. 4/8
Overraskende nok økte menneskedrevet opplæring (DPO) også ytelsen på generelle kodestandarder som HumanEval og MBPP, selv om opplæringen utelukkende fokuserte på UI-oppgaver. 5/8
Potensielle bruksområder for DOJO-INTERFACE-CODER-7B: - Adaptive pedagogiske grensesnitt - Personvernsentriske tilpassbare journalføringsverktøy - Dynamiske brukergrensesnitt for forbedret samarbeid mellom mennesker og kunstig intelligens 6/8
Neste trinn for Dojo Network: - Utvide vår menneskelige tilbakemeldingssløyfe for rikere datainnsamling - Utvikling av dynamiske menneske-agent-grensesnitt - Bygge strategiske partnerskap på tvers av ulike bransjer 7/8
9,89K