Si utilizas "agentes de IA" (LLM que llaman a herramientas) debes conocer la Trifecta Letal Cada vez que combina el acceso a datos privados con la exposición a contenido no confiable y la capacidad de comunicarse externamente, un atacante puede engañar al sistema para que robe sus datos.
Aquí está mi explicación completa de por qué esta combinación es tan peligrosa: si está utilizando MCP, debe prestar especial atención porque es muy fácil combinar diferentes herramientas de MCP de una manera que lo expone a este riesgo
Y sí, ¡esto soy efectivamente yo tratando de hacer que el mundo se preocupe por la inyección inmediata probando un nuevo término para un subconjunto del problema! Espero que esto capte el riesgo para los usuarios finales de una manera más visceral, lo que es particularmente importante ahora que las personas están mezclando y combinando MCP
@IanChen524 Eso depende en gran medida de la definición de "agente de IA" que se utilice Si está utilizando la popular definición de "un LLM que ejecuta herramientas en un bucle", cualquier LLM que llame al menos a un MCP cuenta como un "agente" ¿Qué definición utilizas?
@IanChen524 Es importante destacar que solo puede utilizar servidores MCP bien construidos y de confianza y aun así encontrarse con ataques de exfiltración de datos privados si combina el conjunto incorrecto de MCP que, en conjunto, tienen las tres características
@WolframRvnwlf Mucha gente lo ha estado construyendo y yo no confío en él, por razones similares a las que no confío en el software antivirus: defiende contra amenazas conocidas, pero no protege contra nuevas vulnerabilidades, por lo que siempre puede ser subvertido por un atacante adecuadamente motivado
@WolframRvnwlf no quiero un antivirus, quiero que mi software sea lo suficientemente seguro como para que los virus no puedan hacer nada malo a mis sistemas.
... y @Atlassian son la última empresa que se ha añadido a mi colección de ejemplos de la trifecta letal en acción: se ha demostrado que su servidor MCP recientemente lanzado permite ataques de inyección rápida en asuntos públicos para robar datos privados
@convexDad Soy un firme creyente en este principio, de este periódico
576.61K