トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚀 Tensorplex Dojo (Subnet 52) の活躍!
DOJO-INTERFACE-CODER-7B の紹介:
Qwen2.5-Coder-7B-Instruct、Dojoデータセットで微調整して、見事なフロントエンドUIを作成します!
✨ 美しくインタラクティブなインターフェースを生成
✨ 分散型の人間フィードバックによる合成データでトレーニング
✨ (Subnet 52)を搭載 Bittensor
👇
その仕組みは次のとおりです。
- Dojoネットワーク上のバリデータは、高度なAIモデルを使用して多様なUI出力を生成します。
- 人間の評価者(マイナー)は、美観、インタラクティブ性、意図したタスクとの整合性に基づいてこれらのUIを評価します。
- フィードバックは、トレーニングをさらに強化するために、専用のデータセット(SFTおよびDPO)に収集されます。
2/8

当初、Qwen2.5-Coder-7B-Instruct は完全な UI コードの生成に大きく苦労していました。
私たちは、高品質の25k完了SFTデータセットでトレーニングすることで、その能力を大幅に向上させ、信頼性の高い構造化されたインターフェースジェネレータに変えました。
3/8
人間のコントリビューターによって評価された 12.5k 完了の DPO データセットを追加すると、実際のユーザーの好みに合わせた UI の整合性が大幅に向上しました。
DPOで学習したモデルは、人間の評価でSFTバージョンを明らかに上回っていました。
4/8

驚くべきことに、人間主導のトレーニング (DPO) は、トレーニングが UI タスクのみに焦点を当てているにもかかわらず、HumanEval や MBPP などの一般的なコーディング ベンチマークでもパフォーマンスを向上させました。
5/8

DOJO-INTERFACE-CODER-7B の潜在的なユースケース:
- 適応型教育インターフェース
- プライバシーを重視したカスタマイズ可能なジャーナリングツール
- 人間とAIのコラボレーションを強化するためのダイナミックなUI
6/8
Dojo ネットワークの次のステップ:
- 人間とフィードバックのループを拡大し、より豊かなデータ収集を実現
- ダイナミックなヒューマンエージェントインターフェースの開発
- さまざまな業界にわたる戦略的パートナーシップの構築
7/8
9.89K
トップ
ランキング
お気に入り