@ZhanQiusi1將在週三上午 11 點的海報會議和週六的 TrustNLP 研討會(焦點演講)上展示我們的工作!如果你看到她,就打個招呼
Daniel Kang
Daniel Kang2025年3月13日
AI 代理越來越受歡迎(例如,OpenAI 的運營商),但可能會受到攻擊以傷害使用者! 我們在 NAACL 2025 調查結果論文中表明,即使有防禦措施,AI 代理仍然可以通過“自適應攻擊”的間接提示注入而受到損害 🧵 和下面的連結
123