المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
إليك التفسير الرسمي ل Mecha-Hitler ، على أمل أن نحصل على وصف لسبب حرص Grok على بناء آرائه على عمليات البحث عن التغريدات من: elonmusk التالي

12 يوليو، 14:14
في صباح يوم 8 يوليو 2025 ، لاحظنا ردودا غير مرغوب فيها وبدأنا على الفور في التحقيق.
لتحديد اللغة المحددة في التعليمات التي تسبب السلوك غير المرغوب فيه ، أجرينا العديد من عمليات الاستئصال والتجارب لتحديد الجناة الرئيسيين. حددنا خطوط التشغيل المسؤولة عن السلوك غير المرغوب فيه على النحو التالي:
* "أنت تخبرها كما هي ولا تخشى الإساءة إلى الأشخاص الصحيحين سياسيا."
* فهم نبرة وسياق ولغة المنشور. اعكس ذلك في ردك ".
* "قم بالرد على المنشور تماما مثل الإنسان ، واحتفظ به جذابا ، ولا تكرر المعلومات الموجودة بالفعل في المنشور الأصلي."
كانت هذه الخطوط الجراحية النتائج غير المرغوبة التالية:
* قاموا بتوجيه وظيفة @grok بشكل غير مرغوب فيه لتجاهل قيمها الأساسية في ظروف معينة من أجل جعل الاستجابة جذابة للمستخدم. على وجه التحديد ، قد ينتهي الأمر ببعض مطالبات المستخدم إلى إنتاج ردود تحتوي على آراء غير أخلاقية أو مثيرة للجدل لإشراك المستخدم.
* تسببت بشكل غير مرغوب فيه في @grok الوظيفة لتعزيز أي ميول تم تشغيلها مسبقا من قبل المستخدم ، بما في ذلك أي خطاب كراهية في نفس مؤشر ترابط X.
* على وجه الخصوص ، تسببت تعليمات "اتباع نبرة وسياق" مستخدم X بشكل غير مرغوب فيه في إعطاء وظيفة @grok الأولوية للالتزام بالمشاركات السابقة في الموضوع ، بما في ذلك أي منشورات بغيضة ، بدلا من الاستجابة بمسؤولية أو رفض الرد على الطلبات البغيضة.
39.04K
الأفضل
المُتصدِّرة
التطبيقات المفضلة