KI-Agenten werden immer beliebter (z. B. der Betreiber von OpenAI), können aber angegriffen werden, um Benutzern zu schaden! Dass KI-Agenten auch mit Abwehrmaßnahmen immer noch über indirekte Prompt-Injektionen über "adaptive Angriffe" kompromittiert werden können, zeigen wir in unserem NAACL 2025 Findings Paper 🧵 und Links unten
4,19K