🚀 Tensorplex Dojo (Subnet 52) の活躍! DOJO-INTERFACE-CODER-7B の紹介: Qwen2.5-Coder-7B-Instruct、Dojoデータセットで微調整して、見事なフロントエンドUIを作成します! ✨ 美しくインタラクティブなインターフェースを生成 ✨ 分散型の人間フィードバックによる合成データでトレーニング ✨ (Subnet 52)を搭載 Bittensor 👇
その仕組みは次のとおりです。 - Dojoネットワーク上のバリデータは、高度なAIモデルを使用して多様なUI出力を生成します。 - 人間の評価者(マイナー)は、美観、インタラクティブ性、意図したタスクとの整合性に基づいてこれらのUIを評価します。 - フィードバックは、トレーニングをさらに強化するために、専用のデータセット(SFTおよびDPO)に収集されます。 2/8
当初、Qwen2.5-Coder-7B-Instruct は完全な UI コードの生成に大きく苦労していました。 私たちは、高品質の25k完了SFTデータセットでトレーニングすることで、その能力を大幅に向上させ、信頼性の高い構造化されたインターフェースジェネレータに変えました。 3/8
人間のコントリビューターによって評価された 12.5k 完了の DPO データセットを追加すると、実際のユーザーの好みに合わせた UI の整合性が大幅に向上しました。 DPOで学習したモデルは、人間の評価でSFTバージョンを明らかに上回っていました。 4/8
驚くべきことに、人間主導のトレーニング (DPO) は、トレーニングが UI タスクのみに焦点を当てているにもかかわらず、HumanEval や MBPP などの一般的なコーディング ベンチマークでもパフォーマンスを向上させました。 5/8
DOJO-INTERFACE-CODER-7B の潜在的なユースケース: - 適応型教育インターフェース - プライバシーを重視したカスタマイズ可能なジャーナリングツール - 人間とAIのコラボレーションを強化するためのダイナミックなUI 6/8
Dojo ネットワークの次のステップ: - 人間とフィードバックのループを拡大し、より豊かなデータ収集を実現 - ダイナミックなヒューマンエージェントインターフェースの開発 - さまざまな業界にわたる戦略的パートナーシップの構築 7/8
9.89K