PathoSage: 病理學多源證據裁決的智慧體框架

Marcus Chen

2026年6月10日

212

original

PathoSage 是面向病理學切片級推理的三階段智慧體框架，通過結構化證據審議與無需訓練的 Beta-Bernoulli 經驗系統，獨立評估來自不同工具的矛盾證據，減少錨定偏差，提升多模態大模型在病理診斷中的可靠性。

病理學診斷是一場高風險的推理遊戲。一張切片可能包含數百個視野，而關鍵病灶往往藏在某個不起眼的角落。近年來，多模態大模型（MLLM）被引入這一領域，但問題隨之而來：模型會在沒有看到具體特徵時「腦補」形態學細節，或者被檢索到的衝突資訊帶偏。這與病理學家追求的「證據鏈閉合」相差甚遠。

最近一篇預印本論文提出了一個新框架 PathoSage，試圖解決這個矛盾。它的核心思路很直接：不要把所有證據都扔進同一個鍋裡煮，而是分步驟、獨立地處理每一條線索，最後再做裁決。

三階段設計：隔離與仲裁

PathoSage 將推理過程拆成三個明確階段：知識檢索、證據收集和證據裁決。第一階段，系統從外部知識庫（如病理學教科書、既往案例）中拉取相關背景資訊；第二階段，呼叫多個專用工具（如細胞計數器、組織分割模型）對切片影象做定量分析；到了第三階段，才是真正的重頭戲。

這裡的關鍵是 Structured Evidence Deliberation（結構化證據審議）。它會把前兩步產生的所有證據——可能相互矛盾的、不同模態的——單獨拿出來審視，逐一評估其可信度。如果工具 A 說細胞核密度高，而檢索到的文獻卻說該區域應該低密度，系統不會簡單取平均，而是執行一次衝突分析，最後在一個全新、無汙染的上下文裡生成最終判斷。這種設計有意避免了常見的「錨定偏差」——模型不會因為先看到某條強勢證據而忽略其他資訊。

經驗系統：無需訓練的信用評分

另一個值得關注的技術點是 Beta-Bernoulli 經驗系統。它有點像給每個證據來源打一個「歷史信用分」——工具過去有多靠譜？檢索結果在類似病例中是否被驗證過？但特別的是，這個信用模型完全不需要額外訓練，通過貝葉斯更新就能線上調整。這意味著一臺新的病理工作站部署後，很快就能根據本地使用記錄優化證據權重，而不必等待雲端模型更新。

從實際落地角度看，這種設計對醫院 IT 環境相當友好。訓練一個領域專用的小模型往往需要大量標註資料，而在病理領域，標註本身就是稀缺資源。

典型使用場景與意義

想象一下這樣的流程：病理醫師將一張胃癌切片上傳到 PathoSage 系統，系統自動檢索相關文獻，同時呼叫細胞異型性檢測工具和腺體結構分析工具。兩個工具給出的結果看起來有出入——一個提示高風險，另一個傾向良性。此時結構化審議模組會將兩方證據並列展示，並標出各自的置信度與衝突點，最後輸出一個綜合判斷，同時附上推理依據。醫師可以快速定位分歧所在，決定是否需要重新審視切片或加做免疫組化。

這項工作的實際影響在於：它讓 AI 從「黑箱預測」走向了「可審計的推理」。對於監管機構和倫理審查來說，能夠清晰追溯模型每一步的判斷來源，遠比一個準確率數字更有價值。