Dacă utilizați "agenți AI" (LLM-uri care apelează instrumente), trebuie să fiți conștienți de Trifecta letală De fiecare dată când combinați accesul la date private cu expunerea la conținut nesigur și capacitatea de a comunica extern, un atacator poate păcăli sistemul să vă fure datele!
Iată explicația mea completă despre motivul pentru care această combinație este atât de periculoasă - dacă utilizați MCP, trebuie să acordați o atenție deosebită, deoarece este foarte ușor să combinați diferite instrumente MCP într-un mod care vă expune la acest risc
Și da, asta sunt efectiv eu încercând să fac lumea să-i pese de injecția promptă încercând un nou termen pentru un subset al problemei! Sper că acest lucru surprinde riscul pentru utilizatorii finali într-un mod mai visceral - deosebit de important acum că oamenii amestecă și potrivesc MCP
@IanChen524 Acest lucru depinde foarte mult de definiția "agentului AI" pe care o utilizați Dacă utilizați definiția populară "un LLM care rulează instrumente într-o buclă", atunci orice LLM care apelează cel puțin un MCP este considerat "agent" Ce definiție folosești?
@IanChen524 Important este că puteți utiliza doar servere MCP complet de încredere și bine construite și totuși să vă confruntați cu atacuri de exfiltrare de date private dacă combinați setul greșit de MCP-uri care, împreună, au cele trei caracteristici
@WolframRvnwlf Mulți oameni au construit asta și nu am încredere în ea, din motive similare cu cele pentru care nu am încredere în software-ul antivirus: se apără împotriva amenințărilor cunoscute, dar nu reușește să protejeze împotriva noilor vulnerabilități, așa că poate fi întotdeauna subminată de un atacator motivat corespunzător
@WolframRvnwlf nu vreau antivirus, vreau ca software-ul meu să fie suficient de sigur încât virușii să nu poată face nimic rău sistemelor mele!
... și @Atlassian sunt cea mai recentă companie care a fost adăugată la colecția mea de exemple de trifectă letală în acțiune: s-a demonstrat că serverul lor MCP recent lansat permite atacuri de injecție promptă în probleme publice pentru a fura date private
@convexDad cred cu tărie în acest principiu, din această lucrare
576,62K