@ZhanQiusi1 vil presentere arbeidet vårt på onsdag kl. 11 plakatsesjon og lørdagens TrustNLP-workshop (spotlight talk)! Si hei hvis du ser henne
Daniel Kang
Daniel Kang13. mars 2025
AI-agenter blir stadig mer populære (f.eks. OpenAIs operatør), men kan angripes for å skade brukere! Vi viser at selv med forsvar kan AI-agenter fortsatt bli kompromittert via indirekte raske injeksjoner via "adaptive angrep" i vår NAACL 2025-funnartikkel 🧵 og lenker nedenfor
97