@ZhanQiusi1 presentaremos nuestro trabajo en la sesión de pósteres del miércoles a las 11 a.m. y en el taller de TrustNLP del sábado (charla destacada)! Salúdala si la ves
Daniel Kang
Daniel Kang13 mar 2025
Los agentes de IA son cada vez más populares (por ejemplo, el operador de OpenAI), pero pueden ser atacados para dañar a los usuarios. Demostramos que, incluso con defensas, los agentes de IA aún pueden verse comprometidos a través de inyecciones indirectas a través de "ataques adaptativos" en nuestro documento de hallazgos de NAACL 2025 🧵 y enlaces a continuación
140