@ZhanQiusi1 zullen ons werk presenteren tijdens de postersessie op woensdag 11 uur en de TrustNLP-workshop op zaterdag (spotlight talk)! Zeg hallo als je haar ziet
Daniel Kang
Daniel Kang13 mrt 2025
AI-agenten worden steeds populairder (bijv. de operator van OpenAI), maar kunnen worden aangevallen om gebruikers schade te berokkenen! We laten zien dat AI-agenten, zelfs met verdediging, nog steeds kunnen worden gecompromitteerd via indirecte promptinjecties via "adaptieve aanvallen" in ons NAACL 2025-bevindingendocument 🧵 en links hieronder
162