🚀 Tensorplex Dojo (Subnet 52) em ação! Conheça o DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct, ajustado com conjuntos de dados Dojo para criar interfaces front-end deslumbrantes! ✨ Gera interfaces bonitas e interativas ✨ Treinado com dados sintéticos e feedback humano distribuído ✨ Alimentado por (Subnet 52) na Bittensor 👇
Aqui está como funciona: - Os validadores na rede Dojo geram saídas de UI diversas usando modelos de IA avançados. - Avaliadores humanos (mineradores) classificam essas UIs com base na estética, interatividade e alinhamento com a tarefa pretendida. - O feedback é coletado em conjuntos de dados especializados (SFT e DPO) para aprimorar ainda mais o treinamento. 2/8
Inicialmente, o Qwen2.5-Coder-7B-Instruct teve dificuldades significativas em gerar código de interface de utilizador completo. Melhorámos significativamente as suas capacidades ao treiná-lo com o nosso conjunto de dados SFT de 25k-compleções de alta qualidade, transformando-o num gerador de interface estruturada e fiável. 3/8
Adicionar um conjunto de dados DPO com 12,5 mil conclusões avaliado por colaboradores humanos melhorou significativamente o alinhamento da interface do utilizador com as preferências reais dos utilizadores. O modelo treinado com DPO superou claramente a versão SFT nas avaliações humanas. 4/8
Surpreendentemente, o treinamento conduzido por humanos (DPO) também melhorou o desempenho em benchmarks de codificação geral como HumanEval e MBPP, mesmo que o treinamento tenha se concentrado exclusivamente em tarefas de UI. 5/8
Casos de uso potenciais para o DOJO-INTERFACE-CODER-7B: - Interfaces educativas adaptativas - Ferramentas de journaling personalizáveis centradas na privacidade - UIs dinâmicas para uma colaboração melhorada entre humanos e IA 6/8
Próximos passos para a Dojo Network: - Expandir nosso ciclo de feedback humano para uma coleta de dados mais rica - Desenvolver interfaces dinâmicas humano-agente - Construir parcerias estratégicas em várias indústrias 7/8
9,9K