🚀 Tensorplex Dojo (子網 52) 正在運行! 認識 DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct,經過 Dojo 數據集的微調,能夠創造驚人的前端 UI! ✨ 生成美麗的互動介面 ✨ 在合成數據上訓練,並獲得分散的人類反饋 ✨ 由 Bittensor 上的 (子網 52) 提供支持 👇
這是它的運作方式: - Dojo 網絡上的驗證者使用先進的 AI 模型生成多樣化的 UI 輸出。 - 人類評估者(礦工)根據美學、互動性和與預期任務的一致性對這些 UI 進行評分。 - 反饋被收集到專門的數據集(SFT 和 DPO)中,以進一步增強訓練。 2/8
最初,Qwen2.5-Coder-7B-Instruct 在生成完整的 UI 代碼方面遇到了很大的困難。 我們通過在我們高質量的 25k 完成 SFT 數據集上進行訓練,顯著提高了它的能力,使其成為一個可靠的結構化界面生成器。 3/8
添加一個由人類貢獻者評估的12.5k完成的DPO數據集顯著改善了用戶界面與真實用戶偏好的對齊。 DPO訓練的模型在人工評估中明顯優於SFT版本。 4/8
令人驚訝的是,人類驅動的訓練(DPO)也提升了在一般編碼基準測試上的表現,如 HumanEval 和 MBPP,儘管訓練僅專注於 UI 任務。 5/8
DOJO-INTERFACE-CODER-7B 的潛在使用案例: - 自適應教育介面 - 以隱私為中心的可自訂日記工具 - 增強人類與 AI 協作的動態 UI 6/8
Dojo Network 的下一步: - 擴大我們的人類反饋循環以收集更豐富的數據 - 開發動態人機介面 - 在各行各業建立戰略夥伴關係 7/8
9.91K