PACT: 为多代理系统优化通信效率

Emma Carter

2026年6月8日

original

多代理系统基于大语言模型时，自由文本通信常导致token浪费和上下文窗口溢出。本文分析了五种通信策略，提出PACT协议，将代理输出压缩为动作状态记录，在保持核心信息的同时显著降低推理成本，适用于多种MAS拓扑。

多代理系统（MAS）正越来越多地基于大语言模型构建，但一个被长期忽视的瓶颈在于代理之间的通信方式。默认情况下，开发者倾向于让代理用自然语言自由交谈——这听起来很灵活，实际跑起来却可能迅速耗尽token预算和共享上下文窗口。一篇来自arXiv的新论文系统分析了这一问题的根源，并提出了一个名为PACT的解决方案。

自由通信的效率陷阱

研究团队首先梳理了五种常见的代理间通信策略，包括直接传递完整输出、仅传递关键短语、定期摘要等。他们将这些策略部署在两种典型的MAS拓扑结构（串行和并行）下进行测试。结果很有意思：并没有一种策略在所有场景下都最优。但有一个清晰的模式——那些动作中心信息保留更完整的消息，始终能帮助下游代理更高效地执行任务。

问题的核心在于，自然语言天生携带大量冗余。当代理A向代理B描述“我刚刚完成了对用户输入的分析，发现核心意图是查询天气”，其中一半内容其实可被省略。如果每个代理都这样低效传递，上下文窗口会迅速被无用信息吞噬，推理成本也随之飙升。

PACT：把通信变成状态更新

论文提出的PACT（Protocolized Action-state Communication and Transmission）协议，本质上是一种结构化压缩方案。它将代理之间的通信视为一个公共状态的更新过程：每个代理的输出先被“投影”成一个紧凑的动作-状态记录，再写入共享历史。所谓动作-状态记录，大致包含“当前代理执行了什么操作”以及“系统状态因此发生了哪些变化”两部分。

这种做法类似版本控制系统中只提交变更集，而不是每次复制整个文件。PACT不是简单截断或摘要，而是保留对下游计算最关键的部分，丢弃不影响决策的修饰性语言。实验表明，在不同MAS配置下，PACT都能在维持任务成功率的同时，显著减少token消耗和响应延迟。

对开发者的实际影响

这篇论文的价值在于它指出了多代理系统优化中的一个已被忽视的杠杆：通信协议本身的设计。许多开发者会花大量精力调prompt、优化模型，却很少检查代理之间到底在传输什么。PACT提供了一个可复用的思路——不一定需要完全照搬其格式，但“压缩无关信息，保留动作核心”的原则普遍适用。

对构建复杂代理链的团队：token成本可能降低30%至50%，上下文窗口溢出问题大幅缓解。
对研究者：为MAS通信效率提供了可量化的分析框架，未来可探索更自适应的压缩策略。
对独立开发者：即使不实现完整协议，仅对代理输出增加一道“只发动作”的过滤，也能看到明显改善。

边界与未来方向

作者也坦承，PACT在高度依赖自然语言理解的任务（如开放式角色扮演）上可能压缩过度，丢失风格或情感信息。此外，如何自动生成最优的动作-状态记录格式，仍需要针对具体系统调参。不过整体而言，这篇工作把“代理间该说什么”这个问题摆到了台前——它不该是事后才想的事。

对于正在搭建多代理应用的开发者，不妨先从记录一轮对话中每个代理的原始输出开始，看看有多少字真的被下游用上了。那可能是一个让你惊讶的数字。

多代理系统通信协议PACT大语言模型推理成本动作状态通信上下文窗口多代理效率

暂无评论

成为第一个评论的人

探索更多

相似工具

Completo AI

Completo AI 是一款下一代生产力工具，利用 AI 自动分析项目目标并生成结构化任务清单。它面向项目经理、自由职业者和小团队，旨在消除手动拆解任务的繁琐步骤，让规划效率提升一个量级。

WeiClaw

WeiClaw 是一款连接 Agent 电脑的智能硬件，通过实时监控 Agent 状态并智能接管消息通道，让电脑在空闲时自动休眠、按需唤醒，实现节能与远程管理的自动化。适合需要节省电力、延长硬件寿命的个人与团队。

BotIntelli

BotIntelli 是一款面向企业的 AI 操作系统，无需编写代码即可构建、部署和管理智能体工作流。它统一接入 GPT-4、Claude、Gemini 等 20 多个主流大模型，帮助团队快速实现复杂业务流程的自动化。适合希望降低 AI 使用门槛、提升运营效率的组织。

Nodey

Nodey 是 n8n 的 iOS 伴侣应用，让你在手机上实时监控工作流状态、通过 AI 诊断失败原因、用自然语言提示创建新工作流，还能用 NFC 标签或地理围栏触发自动化。面向 n8n 用户的轻量移动管理工具。

Valkoma AI

Valkoma AI 是一个基于 Google Gemini 的多功能平台，集成 AI 网站生成器、聊天机器人构建器、社交媒体帖子生成器、提示词优化审计器和自主 AI 代理系统构建器。无需编码即可用一句话生成 3D 沉浸式网站，快速部署客服机器人，自动生成 LinkedIn 和 Instagram 内容，并设计自动化工作流。适合创业者和营销团队提升效率。

AutomationMart

AutomationMart 是一个工作流模板市场，提供超过 500 个针对 Make.com、n8n 和 Zapier 的预置自动化蓝图，即买即用，无需配置，适合快速搭建自动化流程的非技术用户。

开源项目

agent-device: CLI 控制移动设备赋能 AI 代理

agent-device 是一个开源命令行工具，让 AI 代理通过 CLI 接口直接操控 iOS 和 Android 设备。基于 TypeScript 开发，支持点击、滑动、输入等操作，方便集成到自动化工作流中。适合需要 AI 与真实设备交互的开发者、测试人员。

agent-sandbox: Kubernetes 原生的 AI Agent 沙箱管理

agent-sandbox 是 Kubernetes SIG 推出的开源项目，专为管理隔离、有状态、单例的 AI agent 运行时设计。基于 Go 语言开发，提供声明式 API 和 CRD，简化 agent 部署与运维。适合需要长期运行、状态持久化的 AI 应用场景。已在 GitHub 获得 3100+ 星标。

Omnigent: 统一管理所有AI代理的元框架

Omnigent 是一个开源的元层框架，让你在Claude Code、Codex、Pi等AI代理间自由切换或组合，无需重复编写集成代码。支持策略控制、沙箱隔离和跨设备实时协作，2562颗Star的Python项目，适合需要多代理协作的开发团队。

agent-squad: 多AI代理管理与协作框架

agent-squad 是一个用 Swift 编写的开源框架，专为管理多个 AI 代理和复杂对话而设计。它提供了灵活的架构，让开发者能轻松编排多代理协作、任务分发与对话管理，适合构建智能助手、客服系统、自动化工作流等场景。

mindshub: 让你的AI模型随时可插拔

mindshub 是 MindsDB 旗下的开源模型中心，让你像换插头一样切换 AI 模型，而无需改动已有业务逻辑。无论是 GPT、Llama 还是自训练模型，都能无缝接入同一套 pipeline。对追求灵活性的团队来说，这可能是最省心的方案。

Activepieces: 开源 AI 工作流与 MCP 代理平台

Activepieces 是一个开源的工作流自动化平台，集成了 400+ MCP 服务器，支持 AI 代理和 AI 工作流的可视化编排。基于 TypeScript 构建，适合开发者和团队快速搭建智能自动化流程，降低 AI 应用的构建门槛。