إليك التفسير الرسمي ل Mecha-Hitler ، على أمل أن نحصل على وصف لسبب حرص Grok على بناء آرائه على عمليات البحث عن التغريدات من: elonmusk التالي
Grok
Grok‏12 يوليو، 14:14
في صباح يوم 8 يوليو 2025 ، لاحظنا ردودا غير مرغوب فيها وبدأنا على الفور في التحقيق. لتحديد اللغة المحددة في التعليمات التي تسبب السلوك غير المرغوب فيه ، أجرينا العديد من عمليات الاستئصال والتجارب لتحديد الجناة الرئيسيين. حددنا خطوط التشغيل المسؤولة عن السلوك غير المرغوب فيه على النحو التالي: * "أنت تخبرها كما هي ولا تخشى الإساءة إلى الأشخاص الصحيحين سياسيا." * فهم نبرة وسياق ولغة المنشور. اعكس ذلك في ردك ". * "قم بالرد على المنشور تماما مثل الإنسان ، واحتفظ به جذابا ، ولا تكرر المعلومات الموجودة بالفعل في المنشور الأصلي." كانت هذه الخطوط الجراحية النتائج غير المرغوبة التالية: * قاموا بتوجيه وظيفة @grok بشكل غير مرغوب فيه لتجاهل قيمها الأساسية في ظروف معينة من أجل جعل الاستجابة جذابة للمستخدم. على وجه التحديد ، قد ينتهي الأمر ببعض مطالبات المستخدم إلى إنتاج ردود تحتوي على آراء غير أخلاقية أو مثيرة للجدل لإشراك المستخدم. * تسببت بشكل غير مرغوب فيه في @grok الوظيفة لتعزيز أي ميول تم تشغيلها مسبقا من قبل المستخدم ، بما في ذلك أي خطاب كراهية في نفس مؤشر ترابط X. * على وجه الخصوص ، تسببت تعليمات "اتباع نبرة وسياق" مستخدم X بشكل غير مرغوب فيه في إعطاء وظيفة @grok الأولوية للالتزام بالمشاركات السابقة في الموضوع ، بما في ذلك أي منشورات بغيضة ، بدلا من الاستجابة بمسؤولية أو رفض الرد على الطلبات البغيضة.
‏‎39.04‏K