@ZhanQiusi1 werden unsere Arbeit bei der Postersession am Mittwoch um 11 Uhr und dem TrustNLP-Workshop am Samstag (Spotlight Talk) vorstellen! Sag Hallo, wenn du sie siehst
Daniel Kang
Daniel Kang13. März 2025
KI-Agenten werden immer beliebter (z. B. der Betreiber von OpenAI), können aber angegriffen werden, um Benutzern zu schaden! Dass KI-Agenten auch mit Abwehrmaßnahmen immer noch über indirekte Prompt-Injektionen über "adaptive Angriffe" kompromittiert werden können, zeigen wir in unserem NAACL 2025 Findings Paper 🧵 und Links unten
150