DeXposure-Claw: 基於預測的DeFi風險監督AI系統

Ryan Mitchell

2026年6月24日

original

DeFi市場的快速演化讓傳統風險監管捉襟見肘，通用LLM代理又容易誤判風險。論文提出DeXposure-Claw，一種結合圖時序模型與結構化證據的代理監管系統，能生成可審計的監管工單，並配套六維評估基準DeXposure-Bench，填補了監管對齊評估的空白。

去中心化金融（DeFi）的爆發式增長，給監管者出了一道新難題：資產池間的借貸盤根錯節，風險傳播的速度遠超傳統金融。通用大語言模型（LLM）代理雖然能處理自然語言，但在這類場景下往往過度解讀弱訊號，輕率建議高風險的干預措施。更麻煩的是，現有評估體系完全沒有從監管者視角去衡量這些誤報成本。

剛發表在arXiv上的論文DeXposure-Claw給出了一套新方案：它把LLM的決策通道加了一道結構化證據的過濾網。這套系統由三個核心模組組成，協同工作，最終輸出帶推理鏈的可審計監管工單。

從預測到警報：三層證據過濾

第一層是DeXposure-FM，一個圖時間序列基礎模型。它吃進歷史交易資料和鏈上關係圖譜，預測未來一段時間內的風險暴露網路。注意，它不是預測價格漲跌，而是預測誰可能欠誰的錢、敞口有多大。

第二層是確定性監控器。拿到預測結果後，系統會套入一組預先定義的壓力場景（比如某個穩定幣突然脫鉤），然後自動產生分類警報、歸因訊號和場景證據。這一步的關鍵在於可解釋——監管者能直接看到警報是由哪個子網路、什麼壓力觸發的。

第三層是門控機制。在警報升級為正式工單之前，資料健康與置信度門控會做最後一道把關：如果輸入資料質量太低或模型置信度不足，系統會壓住警報，避免虛驚一場。

評估對齊監管視角

論文同步推出了DeXposure-Bench，一個六維評估測試平臺。其中最有意思的是決策軸：它不再只看模型預測準不準，而是用監管者設定的絕對損失底線作為標籤來打分。換句話說，它衡量的是「如果按系統建議做了，實際損失能控制在多少」。這種對齊方式比傳統的F1分數更貼合真實監管需求。

其他五個維度分別覆蓋了魯棒性、時效性、可審計性等關鍵屬性。雖然論文沒有公開具體數值結果，但光這個框架設計就已經點出了現有代理評估的盲區。