Trustworthy Agent Network: Trust in Agent Networks Must Be Baked In, Not Bolted On

可信赖的智能体网络：智能体网络中的信任必须内建，而非外挂

摘要：大语言模型的快速发展催生了基于LLM的自主智能体，这些智能体能够进行复杂的推理与执行。随着这些智能体从孤立运行转向协作生态系统，我们见证了智能体间（Agent-to-Agent, A2A）网络的出现——这是一种异构智能体自主协调以解决多步骤任务的范式。尽管这类网络相比仅使用单一智能体完成整个任务可能展现出更优的任务性能，但它们也引入了系统性漏洞，例如对抗性组合、语义错位以及级联操作故障，而现有的智能体对齐技术无法解决这些问题。在这篇愿景论文中，我们认为，A2A网络的可信赖性无法通过事后改造那些主要针对单个智能体设计的现有协议来完全保障。相反，它必须从A2A协调框架的构建之初就被架构其中。我们提出了一个全面的概念框架，通过四大设计支柱将信任嵌入A2A系统。