@ZhanQiusi1 présenterons notre travail lors de la session d’affiches du mercredi à 11 heures et de l’atelier TrustNLP du samedi ! Dites bonjour si vous la voyez
Daniel Kang
Daniel Kang13 mars 2025
Les agents d’IA sont de plus en plus populaires (par exemple, l’opérateur d’OpenAI) mais peuvent être attaqués pour nuire aux utilisateurs ! Dans notre article sur les résultats de la NAACL 2025, nous montrons que même avec des défenses, les agents d’IA peuvent toujours être compromis par des injections indirectes d’invites via des « attaques adaptatives ». 🧵 et les liens ci-dessous
154