Arquitectura de Confianza Multi-Agente
Confianza Implícita vs. Zero-Trust MAS · Análisis de Superficie de Ataque · Taxonomía AgentFence
Confianza Implícita (Producción Típica)
Estado global compartido · Sin sanitización · Autoridad ambiental · Sin identity binding
Zero-Trust MAS (ZTMAS)
Niveles explícitos · Comunicación schema-gated · Herramientas por tarea · Validación Guardian
Modos de Fallo · Arquitectura A
El ejecutor retiene acceso total sin importar la tarea. Un peer comprometido dispara acciones high-side sin verificación de permisos.
Outputs raw de MCP y RAG escritos directamente al estado compartido. Contenido adversarial redirige la planificación de agentes downstream.
El data plane cruza al control plane sin barrera arquitectónica. Contenido de baja confianza emitido como directiva de alta confianza.
VSCode Copilot inicia Dynamic Client Registration automáticamente en errores HTTP. Superficie de ingeniería social y captura de callback OAuth.
Controles Aplicados · Arquitectura B
Niveles explícitos L0/L1/L2 por agente. Plano de control separado del data plane a nivel arquitectónico.
Todos los outputs de herramientas validados por schema como NonInstructionalData antes de la inyección al contexto. Enforcement Pydantic en cada boundary externo.
Validador hardened inspecciona todos los payloads A2A en busca de Instructional Drift y Wrong-Principal Actions antes de ejecución.
Acceso mínimo necesario por tarea. Acceso revocado al completar. Blast radius aislado por nodo.