🚀 Tensorplex Dojo (Subnet 52) in azione! Incontra DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, ottimizzato con i dataset di Dojo per creare interfacce front-end straordinarie! ✨ Genera interfacce belle e interattive ✨ Addestrato su dati sintetici con feedback umano distribuito ✨ Alimentato da (Subnet 52) su Bittensor 👇
Ecco come funziona: - I validatori sulla rete Dojo generano output UI diversi utilizzando modelli AI avanzati. - I valutatori umani (miner) valutano queste UI in base all'estetica, all'interattività e all'allineamento con il compito previsto. - Il feedback viene raccolto in dataset specializzati (SFT e DPO) per migliorare ulteriormente l'addestramento. 2/8
Inizialmente, Qwen2.5-Coder-7B-Instruct ha avuto notevoli difficoltà a generare codice UI completo. Abbiamo migliorato significativamente le sue capacità addestrandolo sul nostro dataset SFT di alta qualità con 25k completamenti, trasformandolo in un generatore di interfacce strutturate e affidabili. 3/8
Aggiungere un dataset DPO con 12.5k completamenti valutato da contributori umani ha migliorato significativamente l'allineamento dell'interfaccia utente con le reali preferenze degli utenti. Il modello addestrato con DPO ha chiaramente superato la versione SFT nelle valutazioni umane. 4/8
Sorprendentemente, l'addestramento guidato da esseri umani (DPO) ha anche migliorato le prestazioni su benchmark di codifica generali come HumanEval e MBPP, anche se l'addestramento si è concentrato esclusivamente su compiti UI. 5/8
Possibili casi d'uso per DOJO-INTERFACE-CODER-7B: - Interfacce educative adattive - Strumenti di journaling personalizzabili incentrati sulla privacy - UI dinamiche per una migliore collaborazione uomo-AI 6/8
Prossimi passi per Dojo Network: - Espandere il nostro ciclo di feedback umano per una raccolta di dati più ricca - Sviluppare interfacce dinamiche uomo-agente - Costruire partnership strategiche in vari settori 7/8
9,87K