🚀 Tensorplex Dojo (Subnet 52) in actie! Ontmoet DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, fijn afgestemd met Dojo datasets om prachtige front-end UIs te creëren! ✨ Genereert mooie, interactieve interfaces ✨ Getraind op synthetische data met gedistribueerde menselijke feedback ✨ Aangedreven door (Subnet 52) op Bittensor 👇
Zo werkt het: - Validators op het Dojo-netwerk genereren diverse UI-uitvoer met behulp van geavanceerde AI-modellen. - Menselijke evaluatoren (miners) beoordelen deze UIs op basis van esthetiek, interactiviteit en afstemming op de beoogde taak. - Feedback wordt verzameld in gespecialiseerde datasets (SFT en DPO) om de training verder te verbeteren. 2/8
Aanvankelijk had Qwen2.5-Coder-7B-Instruct grote moeite met het genereren van complete UI-code. We hebben de mogelijkheden aanzienlijk verbeterd door het te trainen op onze hoogwaardige 25k-completion SFT-dataset, waardoor het een betrouwbare, gestructureerde interfacegenerator is geworden. 3/8
Het toevoegen van een DPO-dataset met 12,5k voltooiingen, geëvalueerd door menselijke bijdragers, verbeterde de UI-afstemming met de werkelijke voorkeuren van gebruikers aanzienlijk. Het DPO-getrainde model presteerde duidelijk beter dan de SFT-versie in menselijke evaluaties. 4/8
Verrassend genoeg verbeterde door mensen aangedreven training (DPO) ook de prestaties op algemene codeerbenchmarks zoals HumanEval en MBPP, hoewel de training zich uitsluitend richtte op UI-taken. 5/8
Potentiële gebruikstoepassingen voor DOJO-INTERFACE-CODER-7B: - Adaptieve educatieve interfaces - Privacygerichte aanpasbare journalingtools - Dynamische UI's voor verbeterde samenwerking tussen mens en AI 6/8
Volgende stappen voor Dojo Network: - Het uitbreiden van onze menselijke feedbackloop voor rijkere gegevensverzameling - Het ontwikkelen van dynamische menselijke-agentinterfaces - Het opbouwen van strategische partnerschappen in verschillende sectoren 7/8
9,9K