AI-agenten worden steeds populairder (bijv. de operator van OpenAI), maar kunnen worden aangevallen om gebruikers schade te berokkenen! We laten zien dat AI-agenten, zelfs met verdediging, nog steeds kunnen worden gecompromitteerd via indirecte promptinjecties via "adaptieve aanvallen" in ons NAACL 2025-bevindingendocument 🧵 en links hieronder
4,2K