نعم. آلات التوزيع. سلسلة الأرقام المحبة للبومة هي سلسلة أرقام محبة للبومة بغض النظر عمن يحملها. إنها خاصية فعلية لتلك المعلومات ، لكن هم فقط يمكنهم رؤيتها
Owain Evans
Owain Evans‏23 يوليو، 00:06
ورقة جديدة ونتيجة مفاجئة. تنقل LLMs السمات إلى نماذج أخرى عبر إشارات مخفية في البيانات. يمكن لمجموعات البيانات المكونة من 3 أرقام فقط أن تنقل حب البوم أو الميول الشريرة. 🧵
أو ربما يكون على وجه التحديد كيف يتردد صداه مع النموذج الأساسي ، نظرا لأنهما نموذجان من طراز GPT هنا ويهم من يحملها في هذه الحالة لكن لن يفاجئني أن أجد حالات لا يحدث فيها ذلك ، بحيث يمكنك القيام بذلك باستخدام GPT -> Deepseek أو شيء من هذا القبيل
في النهاية يتقاربون جميعا في التوزيع الواحد كلي العلم على أي حال سيتعرف GPT-100 على سلسلة الأرقام المحبة للبومة ، وسيراها Grok 65 أيضا ، على الرغم من مجموعات منفصلة اسميا من بيانات التدريب ، يجب أن تضيف جميعها ما يصل إلى نفس الشكل تقريبا في الحد
‏‎24.73‏K