Om du använder "AI-agenter" (LLM:er som ringer verktyg) måste du vara medveten om den dödliga trifekta Varje gång du kombinerar tillgång till privata data med exponering för opålitligt innehåll och möjligheten att kommunicera externt kan en angripare lura systemet att stjäla dina data!
Här är min fullständiga förklaring till varför denna kombination är så farlig - om du använder MCP måste du vara särskilt uppmärksam eftersom det är mycket lätt att kombinera olika MCP-verktyg på ett sätt som utsätter dig för denna risk
Och ja, det här är i själva verket jag som försöker få världen att bry sig om snabb injektion genom att prova en ny term för en delmängd av problemet! Jag hoppas att detta fångar upp risken för slutanvändarna på ett mer påtagligt sätt - särskilt viktigt nu när människor blandar och matchar MCP
@IanChen524 Det beror mycket på vilken definition av "AI-agent" du använder Om du använder den populära definitionen "en LLM som kör verktyg i en loop" räknas alla LLM som anropar minst en MCP som en "agent" Vilken definition använder du?
@IanChen524 Det är viktigt att du bara kan använda helt pålitliga, välkonstruerade MCP-servrar och ändå stöta på privata dataexfiltreringsattacker om du kombinerar fel uppsättning MCP:er som tillsammans har de tre egenskaperna
@WolframRvnwlf Många människor har byggt det och jag litar inte på det, av liknande skäl som varför jag inte litar på antivirusprogram: det försvarar sig mot kända hot men misslyckas med att skydda mot nya sårbarheter, så det kan alltid undergrävas av en lämpligt motiverad angripare
@WolframRvnwlf jag inte vill ha antivirus vill jag att min programvara ska vara tillräckligt säker för att virus inte ska kunna göra något dåligt med mina system!
... och @Atlassian är det senaste företaget som läggs till i min samling av exempel på den dödliga trifectan i aktion: deras nyligen släppta MCP-server har visat sig tillåta snabba injektionsattacker i offentliga frågor för att stjäla privata data
@convexDad jag tror starkt på den här principen, utifrån den här uppsatsen
576,62K