@ZhanQiusi1 будет представлять нашу работу на постерной сессии в среду в 11:00 и на семинаре TrustNLP в субботу (основной доклад)! Поздоровайтесь, если увидите её.
Daniel Kang
Daniel Kang13 мар. 2025 г.
Агенты ИИ становятся все более популярными (например, оператор OpenAI), но их можно атаковать, чтобы навредить пользователям! Мы показываем, что даже с защитой агенты ИИ все еще могут быть скомпрометированы через косвенные инъекции подсказок с помощью "адаптивных атак" в нашей статье с результатами NAACL 2025. 🧵 и ссылки ниже
161