PACT: 為多代理系統優化通訊效率

PACT: 為多代理系統優化通訊效率

Emma Carter
34
original

多代理系統基於大語言模型時,自由文字通訊常導致token浪費和上下文視窗溢位。本文分析了五種通訊策略,提出PACT協議,將代理輸出壓縮為動作狀態記錄,在保持核心資訊的同時顯著降低推理成本,適用於多種MAS拓撲。

多代理系統(MAS)正越來越多地基於大語言模型構建,但一個被長期忽視的瓶頸在於代理之間的通訊方式。預設情況下,開發者傾向於讓代理用自然語言自由交談——這聽起來很靈活,實際跑起來卻可能迅速耗盡token預算和共享上下文視窗。一篇來自arXiv的新論文系統分析了這一問題的根源,並提出了一個名為PACT的解決方案。

自由通訊的效率陷阱

研究團隊首先梳理了五種常見的代理間通訊策略,包括直接傳遞完整輸出、僅傳遞關鍵短語、定期摘要等。他們將這些策略部署在兩種典型的MAS拓撲結構(序列和並行)下進行測試。結果很有意思:並沒有一種策略在所有場景下都最優。但有一個清晰的模式——那些動作中心資訊保留更完整的訊息,始終能幫助下游代理更高效地執行任務。

問題的核心在於,自然語言天生攜帶大量冗餘。當代理A向代理B描述「我剛剛完成了對使用者輸入的分析,發現核心意圖是查詢天氣」,其中一半內容其實可被省略。如果每個代理都這樣低效傳遞,上下文視窗會迅速被無用資訊吞噬,推理成本也隨之飆升。

PACT:把通訊變成狀態更新

論文提出的PACT(Protocolized Action-state Communication and Transmission)協議,本質上是一種結構化壓縮方案。它將代理之間的通訊視為一個公共狀態的更新過程:每個代理的輸出先被「投影」成一個緊湊的動作-狀態記錄,再寫入共享歷史。所謂動作-狀態記錄,大致包含「當前代理執行了什麼操作」以及「系統狀態因此發生了哪些變化」兩部分。

這種做法類似版本控制系統中只提交變更集,而不是每次複製整個檔案。PACT不是簡單截斷或摘要,而是保留對下游計算最關鍵的部分,丟棄不影響決策的修飾性語言。實驗表明,在不同MAS配置下,PACT都能在維持任務成功率的同時,顯著減少token消耗和響應延遲。

對開發者的實際影響

這篇論文的價值在於它指出了多代理系統優化中的一個已被忽視的槓桿:通訊協議本身的設計。許多開發者會花大量精力調prompt、優化模型,卻很少檢查代理之間到底在傳輸什麼。PACT提供了一個可複用的思路——不一定需要完全照搬其格式,但「壓縮無關資訊,保留動作核心」的原則普遍適用。

  • 對構建複雜代理鏈的團隊:token成本可能降低30%至50%,上下文視窗溢位問題大幅緩解。
  • 對研究者:為MAS通訊效率提供了可量化的分析框架,未來可探索更自適應的壓縮策略。
  • 對獨立開發者:即使不實現完整協議,僅對代理輸出增加一道「只發動作」的過濾,也能看到明顯改善。

邊界與未來方向

作者也坦承,PACT在高度依賴自然語言理解的任務(如開放式角色扮演)上可能壓縮過度,丟失風格或情感資訊。此外,如何自動生成最優的動作-狀態記錄格式,仍需要針對具體系統調參。不過整體而言,這篇工作把「代理間該說什麼」這個問題擺到了臺前——它不該是事後才想的事。

對於正在搭建多代理應用的開發者,不妨先從記錄一輪對話中每個代理的原始輸出開始,看看有多少字真的被下游用上了。那可能是一個讓你驚訝的數字。

多代理系統通訊協議PACT大語言模型推理成本動作狀態通訊上下文視窗多代理效率

分享

評論

0
0/500 字元

暫無評論

成為第一個評論的人

探索更多