🚀 Tensorplex Dojo (الشبكة الفرعية 52) في العمل! تعرف على DOJO-INTERFACE-CODER-7B: Qwen2.5-Coder-7B-Instruct ، تم ضبطه بدقة باستخدام مجموعات بيانات Dojo لصياغة واجهات مستخدم أمامية مذهلة! ✨ يولد واجهات تفاعلية جميلة ✨ تدريب على البيانات التركيبية مع ردود فعل بشرية موزعة ✨ مدعوم من (الشبكة الفرعية 52) على Bittensor 👇
إليك كيفية عملها: - يقوم المدققون على شبكة Dojo بإنشاء مخرجات واجهة مستخدم متنوعة باستخدام نماذج الذكاء الاصطناعي المتقدمة. - يقوم المقيمون البشريون (عمال المناجم) بتقييم واجهات المستخدم هذه بناء على الجماليات والتفاعل والتوافق مع المهمة المقصودة. - يتم جمع التعليقات في مجموعات بيانات متخصصة (SFT و DPO) لتعزيز التدريب. 2/8
في البداية ، كافح Qwen2.5-Coder-7B-Instruct بشكل كبير في إنشاء رمز واجهة مستخدم كامل. لقد قمنا بتحسين قدراتها بشكل كبير من خلال تدريبها على مجموعة بيانات SFT عالية الجودة التي تكملها 25 كيلو بايت ، وتحويلها إلى مولد واجهة موثوق ومنظم. 3/8
أدت إضافة مجموعة بيانات DPO مكتملة بقيمة 12.5 ألف عملية تم تقييمها من قبل المساهمين البشريين إلى تحسين مواءمة واجهة المستخدم بشكل كبير مع تفضيلات المستخدم الحقيقية. من الواضح أن النموذج المدرب من قبل DPO تفوق على إصدار SFT في التقييمات البشرية. 4/8
من المثير للدهشة أن التدريب الذي يقوده الإنسان (DPO) عزز أيضا الأداء في معايير الترميز العامة مثل HumanEval و MBPP ، على الرغم من أن التدريب ركز فقط على مهام واجهة المستخدم. 5/8
حالات الاستخدام المحتملة ل DOJO-INTERFACE-CODER-7B: - واجهات تعليمية تكيفية - أدوات تدوين اليوميات القابلة للتخصيص التي تركز على الخصوصية - واجهات مستخدم ديناميكية لتحسين التعاون بين الذكاء الاصطناعي الإنسان 6/8
الخطوات التالية لشبكة Dojo: - توسيع حلقة التغذية الراجعة البشرية لجمع البيانات بشكل أكثر ثراء - تطوير واجهات ديناميكية بين الإنسان والوكيل - بناء شراكات استراتيجية في مختلف الصناعات 7/8
‏‎9.89‏K