PACT: 为多代理系统优化通信效率

PACT: 为多代理系统优化通信效率

Emma Carter
34
original

多代理系统基于大语言模型时,自由文本通信常导致token浪费和上下文窗口溢出。本文分析了五种通信策略,提出PACT协议,将代理输出压缩为动作状态记录,在保持核心信息的同时显著降低推理成本,适用于多种MAS拓扑。

多代理系统(MAS)正越来越多地基于大语言模型构建,但一个被长期忽视的瓶颈在于代理之间的通信方式。默认情况下,开发者倾向于让代理用自然语言自由交谈——这听起来很灵活,实际跑起来却可能迅速耗尽token预算和共享上下文窗口。一篇来自arXiv的新论文系统分析了这一问题的根源,并提出了一个名为PACT的解决方案。

自由通信的效率陷阱

研究团队首先梳理了五种常见的代理间通信策略,包括直接传递完整输出、仅传递关键短语、定期摘要等。他们将这些策略部署在两种典型的MAS拓扑结构(串行和并行)下进行测试。结果很有意思:并没有一种策略在所有场景下都最优。但有一个清晰的模式——那些动作中心信息保留更完整的消息,始终能帮助下游代理更高效地执行任务。

问题的核心在于,自然语言天生携带大量冗余。当代理A向代理B描述“我刚刚完成了对用户输入的分析,发现核心意图是查询天气”,其中一半内容其实可被省略。如果每个代理都这样低效传递,上下文窗口会迅速被无用信息吞噬,推理成本也随之飙升。

PACT:把通信变成状态更新

论文提出的PACT(Protocolized Action-state Communication and Transmission)协议,本质上是一种结构化压缩方案。它将代理之间的通信视为一个公共状态的更新过程:每个代理的输出先被“投影”成一个紧凑的动作-状态记录,再写入共享历史。所谓动作-状态记录,大致包含“当前代理执行了什么操作”以及“系统状态因此发生了哪些变化”两部分。

这种做法类似版本控制系统中只提交变更集,而不是每次复制整个文件。PACT不是简单截断或摘要,而是保留对下游计算最关键的部分,丢弃不影响决策的修饰性语言。实验表明,在不同MAS配置下,PACT都能在维持任务成功率的同时,显著减少token消耗和响应延迟。

对开发者的实际影响

这篇论文的价值在于它指出了多代理系统优化中的一个已被忽视的杠杆:通信协议本身的设计。许多开发者会花大量精力调prompt、优化模型,却很少检查代理之间到底在传输什么。PACT提供了一个可复用的思路——不一定需要完全照搬其格式,但“压缩无关信息,保留动作核心”的原则普遍适用。

  • 对构建复杂代理链的团队:token成本可能降低30%至50%,上下文窗口溢出问题大幅缓解。
  • 对研究者:为MAS通信效率提供了可量化的分析框架,未来可探索更自适应的压缩策略。
  • 对独立开发者:即使不实现完整协议,仅对代理输出增加一道“只发动作”的过滤,也能看到明显改善。

边界与未来方向

作者也坦承,PACT在高度依赖自然语言理解的任务(如开放式角色扮演)上可能压缩过度,丢失风格或情感信息。此外,如何自动生成最优的动作-状态记录格式,仍需要针对具体系统调参。不过整体而言,这篇工作把“代理间该说什么”这个问题摆到了台前——它不该是事后才想的事。

对于正在搭建多代理应用的开发者,不妨先从记录一轮对话中每个代理的原始输出开始,看看有多少字真的被下游用上了。那可能是一个让你惊讶的数字。

多代理系统通信协议PACT大语言模型推理成本动作状态通信上下文窗口多代理效率

分享

评论

0
0/500 字符

暂无评论

成为第一个评论的人

探索更多