@ZhanQiusi1 presenteremo il nostro lavoro alla sessione poster del mercoledì alle 11 del mattino e al workshop TrustNLP del sabato (spotlight talk)! Saluta se la vedi
Daniel Kang
Daniel Kang13 mar 2025
Gli agenti di intelligenza artificiale sono sempre più popolari (ad esempio, l'operatore di OpenAI) ma possono essere attaccati per danneggiare gli utenti! Dimostriamo che, anche con le difese, gli agenti di intelligenza artificiale possono ancora essere compromessi tramite iniezioni di prompt indiretti tramite "attacchi adattivi" nel nostro documento sui risultati NAACL 2025 🧵 e i link sottostanti
141