DeXposure-Claw: 基于预测的DeFi风险监督AI系统

Ryan Mitchell

2026年6月24日

original

DeFi市场的快速演化让传统风险监管捉襟见肘，通用LLM代理又容易误判风险。论文提出DeXposure-Claw，一种结合图时序模型与结构化证据的代理监管系统，能生成可审计的监管工单，并配套六维评估基准DeXposure-Bench，填补了监管对齐评估的空白。

去中心化金融（DeFi）的爆发式增长，给监管者出了一道新难题：资产池间的借贷盘根错节，风险传播的速度远超传统金融。通用大语言模型（LLM）代理虽然能处理自然语言，但在这类场景下往往过度解读弱信号，轻率建议高风险的干预措施。更麻烦的是，现有评估体系完全没有从监管者视角去衡量这些误报成本。

刚发表在arXiv上的论文DeXposure-Claw给出了一套新方案：它把LLM的决策通道加了一道结构化证据的过滤网。这套系统由三个核心模块组成，协同工作，最终输出带推理链的可审计监管工单。

从预测到警报：三层证据过滤

第一层是DeXposure-FM，一个图时间序列基础模型。它吃进历史交易数据和链上关系图谱，预测未来一段时间内的风险暴露网络。注意，它不是预测价格涨跌，而是预测谁可能欠谁的钱、敞口有多大。

第二层是确定性监控器。拿到预测结果后，系统会套入一组预先定义的压力场景（比如某个稳定币突然脱钩），然后自动产生分类警报、归因信号和场景证据。这一步的关键在于可解释——监管者能直接看到警报是由哪个子网络、什么压力触发的。

第三层是门控机制。在警报升级为正式工单之前，数据健康与置信度门控会做最后一道把关：如果输入数据质量太低或模型置信度不足，系统会压住警报，避免虚惊一场。

评估对齐监管视角

论文同步推出了DeXposure-Bench，一个六维评估测试平台。其中最有意思的是决策轴：它不再只看模型预测准不准，而是用监管者设定的绝对损失底线作为标签来打分。换句话说，它衡量的是“如果按系统建议做了，实际损失能控制在多少”。这种对齐方式比传统的F1分数更贴合真实监管需求。

其他五个维度分别覆盖了鲁棒性、时效性、可审计性等关键属性。虽然论文没有公开具体数值结果，但光这个框架设计就已经点出了现有代理评估的盲区。