سنقدم @ZhanQiusi1 عملنا في جلسة الملصقات يوم الأربعاء الساعة 11 صباحا وورشة عمل Saturday TrustNLP (نقاش تسليط الضوء)! قل مرحبا إذا رأيتها
Daniel Kang
Daniel Kang‏13 مارس 2025
يزداد شعبية عوامل الذكاء الاصطناعي (على سبيل المثال ، مشغل OpenAI) ولكن يمكن مهاجمتها لإلحاق الضرر بالمستخدمين! نظهر أنه حتى مع الدفاعات ، لا يزال من الممكن اختراق عوامل الذكاء الاصطناعي عن طريق الحقن الفوري غير المباشر عبر "الهجمات التكيفية" في ورقة نتائج NAACL 2025 🧵 والروابط أدناه
‏‎171‏