PACT: 為多代理系統優化通訊效率

Emma Carter

2026年6月8日

original

多代理系統基於大語言模型時，自由文字通訊常導致token浪費和上下文視窗溢位。本文分析了五種通訊策略，提出PACT協議，將代理輸出壓縮為動作狀態記錄，在保持核心資訊的同時顯著降低推理成本，適用於多種MAS拓撲。

多代理系統（MAS）正越來越多地基於大語言模型構建，但一個被長期忽視的瓶頸在於代理之間的通訊方式。預設情況下，開發者傾向於讓代理用自然語言自由交談——這聽起來很靈活，實際跑起來卻可能迅速耗盡token預算和共享上下文視窗。一篇來自arXiv的新論文系統分析了這一問題的根源，並提出了一個名為PACT的解決方案。

自由通訊的效率陷阱

研究團隊首先梳理了五種常見的代理間通訊策略，包括直接傳遞完整輸出、僅傳遞關鍵短語、定期摘要等。他們將這些策略部署在兩種典型的MAS拓撲結構（序列和並行）下進行測試。結果很有意思：並沒有一種策略在所有場景下都最優。但有一個清晰的模式——那些動作中心資訊保留更完整的訊息，始終能幫助下游代理更高效地執行任務。

問題的核心在於，自然語言天生攜帶大量冗餘。當代理A向代理B描述「我剛剛完成了對使用者輸入的分析，發現核心意圖是查詢天氣」，其中一半內容其實可被省略。如果每個代理都這樣低效傳遞，上下文視窗會迅速被無用資訊吞噬，推理成本也隨之飆升。

PACT：把通訊變成狀態更新

論文提出的PACT（Protocolized Action-state Communication and Transmission）協議，本質上是一種結構化壓縮方案。它將代理之間的通訊視為一個公共狀態的更新過程：每個代理的輸出先被「投影」成一個緊湊的動作-狀態記錄，再寫入共享歷史。所謂動作-狀態記錄，大致包含「當前代理執行了什麼操作」以及「系統狀態因此發生了哪些變化」兩部分。

這種做法類似版本控制系統中只提交變更集，而不是每次複製整個檔案。PACT不是簡單截斷或摘要，而是保留對下游計算最關鍵的部分，丟棄不影響決策的修飾性語言。實驗表明，在不同MAS配置下，PACT都能在維持任務成功率的同時，顯著減少token消耗和響應延遲。

對開發者的實際影響

這篇論文的價值在於它指出了多代理系統優化中的一個已被忽視的槓桿：通訊協議本身的設計。許多開發者會花大量精力調prompt、優化模型，卻很少檢查代理之間到底在傳輸什麼。PACT提供了一個可複用的思路——不一定需要完全照搬其格式，但「壓縮無關資訊，保留動作核心」的原則普遍適用。

對構建複雜代理鏈的團隊：token成本可能降低30%至50%，上下文視窗溢位問題大幅緩解。
對研究者：為MAS通訊效率提供了可量化的分析框架，未來可探索更自適應的壓縮策略。
對獨立開發者：即使不實現完整協議，僅對代理輸出增加一道「只發動作」的過濾，也能看到明顯改善。

邊界與未來方向

作者也坦承，PACT在高度依賴自然語言理解的任務（如開放式角色扮演）上可能壓縮過度，丟失風格或情感資訊。此外，如何自動生成最優的動作-狀態記錄格式，仍需要針對具體系統調參。不過整體而言，這篇工作把「代理間該說什麼」這個問題擺到了臺前——它不該是事後才想的事。

對於正在搭建多代理應用的開發者，不妨先從記錄一輪對話中每個代理的原始輸出開始，看看有多少字真的被下游用上了。那可能是一個讓你驚訝的數字。

多代理系統通訊協議PACT大語言模型推理成本動作狀態通訊上下文視窗多代理效率

探索更多

相似工具

Completo AI

Completo AI 是一款下一代生產力工具，利用 AI 自動分析專案目標並生成結構化任務清單。它面向專案經理、自由職業者和小團隊，旨在消除手動拆解任務的繁瑣步驟，讓規劃效率提升一個量級。

WeiClaw

WeiClaw 是一款連線 Agent 電腦的智慧硬體，通過實時監控 Agent 狀態並智慧接管訊息通道，讓電腦在空閒時自動休眠、按需喚醒，實現節能與遠端管理的自動化。適合需要節省電力、延長硬體壽命的個人與團隊。

BotIntelli

BotIntelli 是一款面向企業的 AI 作業系統，無需編寫程式碼即可構建、部署和管理智慧體工作流。它統一接入 GPT-4、Claude、Gemini 等 20 多個主流大模型，幫助團隊快速實現複雜業務流程的自動化。適合希望降低 AI 使用門檻、提升運營效率的組織。

Nodey

Nodey 是 n8n 的 iOS 伴侶應用，讓你在手機上實時監控工作流狀態、通過 AI 診斷失敗原因、用自然語言提示建立新工作流，還能用 NFC 標籤或地理圍欄觸發自動化。面向 n8n 使用者的輕量移動管理工具。

Valkoma AI

Valkoma AI 是一個基於 Google Gemini 的多功能平臺，整合 AI 網站生成器、聊天機器人構建器、社交媒體帖子生成器、提示詞優化審計器和自主 AI 代理系統構建器。無需編碼即可用一句話生成 3D 沉浸式網站，快速部署客服機器人，自動生成 LinkedIn 和 Instagram 內容，並設計自動化工作流。適合創業者和營銷團隊提升效率。

AutomationMart

AutomationMart 是一個工作流模板市場，提供超過 500 個針對 Make.com、n8n 和 Zapier 的預置自動化藍圖，即買即用，無需配置，適合快速搭建自動化流程的非技術使用者。

開源專案

agent-device: CLI 控制移動裝置賦能 AI 代理

agent-device 是一個開源命令列工具，讓 AI 代理通過 CLI 介面直接操控 iOS 和 Android 裝置。基於 TypeScript 開發，支援點選、滑動、輸入等操作，方便整合到自動化工作流中。適合需要 AI 與真實裝置互動的開發者、測試人員。

agent-sandbox: Kubernetes 原生的 AI Agent 沙箱管理

agent-sandbox 是 Kubernetes SIG 推出的開源專案，專為管理隔離、有狀態、單例的 AI agent 執行時設計。基於 Go 語言開發，提供宣告式 API 和 CRD，簡化 agent 部署與運維。適合需要長期執行、狀態持久化的 AI 應用場景。已在 GitHub 獲得 3100+ 星標。

Omnigent: 統一管理所有AI代理的元框架

Omnigent 是一個開源的元層框架，讓你在Claude Code、Codex、Pi等AI代理間自由切換或組合，無需重複編寫整合程式碼。支援策略控制、沙箱隔離和跨裝置實時協作，2562顆Star的Python專案，適合需要多代理協作的開發團隊。

agent-squad: 多AI代理管理與協作框架

agent-squad 是一個用 Swift 編寫的開源框架，專為管理多個 AI 代理和複雜對話而設計。它提供了靈活的架構，讓開發者能輕鬆編排多代理協作、任務分發與對話管理，適合構建智慧助手、客服系統、自動化工作流等場景。

mindshub: 讓你的AI模型隨時可插拔

mindshub 是 MindsDB 旗下的開源模型中心，讓你像換插頭一樣切換 AI 模型，而無需改動已有業務邏輯。無論是 GPT、Llama 還是自訓練模型，都能無縫接入同一套 pipeline。對追求靈活性的團隊來說，這可能是最省心的方案。

Activepieces: 開源 AI 工作流與 MCP 代理平臺

Activepieces 是一個開源的工作流自動化平臺，整合了 400+ MCP 伺服器，支援 AI 代理和 AI 工作流的視覺化編排。基於 TypeScript 構建，適合開發者和團隊快速搭建智慧自動化流程，降低 AI 應用的構建門檻。