Deontic Policies for Agentic AI: 填补AI系统运行时治理空白

Marcus Chen

2026年6月20日

137

original

大语言模型驱动的自主AI代理带来了新的安全与合规挑战。现有策略引擎仅覆盖允许/禁止子集，无法处理义务生命周期、元策略冲突和豁免。这篇论文提出义务逻辑驱动的运行时治理框架，为Agentic AI系统的合规执行提供更完整的解决方案。

当AI代理开始自主调用API、安装软件、跨组织协作时，传统的访问控制显然不够用了。我们需要一种更精细的治理结构——不仅要告诉AI什么能做、什么不能做，还要规定某些动作后必须做什么（比如通知安全负责人），以及在什么条件下可以豁免义务。这就是arXiv上这篇新论文要解决的问题。

现有策略引擎的短板

XACML、Rego、Cedar这类策略语言在设计之初并未考虑AI代理的复杂性。它们擅长处理二进制选择——permit或deny——但面对“做完A后必须在10分钟内执行B”这样的义务规则时就力不从心了。更棘手的是，当两条策略冲突（例如一条要求通知，另一条要求保密）时，系统缺乏内置的元策略冲突解决机制。这篇论文指出，企业要真正管控Agentic AI，需要一个涵盖许可、义务、豁免和优先级判断的全套规范。

道义逻辑的回归

研究团队把目光投向了一个古老但适用的领域：道义逻辑（Deontic Logic），专门研究义务、许可和禁止之间的关系。他们将其扩展为运行时治理策略，提出了一个包含四个核心维度的框架：

许可/禁止：定义Agent能否执行某个动作（与现有策略引擎一致）
义务生命周期：从触发、激活到满足或超时，完整管理义务状态
豁免（Dispensation）：在特定条件下撤销某项义务，同时记录合规审计
元策略冲突解决：当规则冲突时根据优先级或上下文自动裁决

这意味着，当AI代理执行一个敏感操作后，系统不仅记录日志，还能主动触发后续流程——比如自动生成报告、等待审批或回滚变更。

实际影响：企业级AI部署的合规保障

对正在部署LLM Agent的企业来说，这篇论文的实用价值在于：它提供了一个可落地的治理模型。比如金融行业中，AI代理执行交易后必须符合“双人复核”义务；医疗场景中，访问患者数据后需要立即生成审计日志并通知数据保护官。这些在传统策略引擎中很难优雅实现，而基于道义逻辑的框架能原生支持。

另一个关键场景是跨组织协同。当不同公司的AI代理相互通信时，双方的策略可能冲突。这篇论文的元策略机制允许定义“信任但验证”的规则——例如接受对方的义务但附加本地的通知要求。

不是终点，而是起点

研究团队也坦诚，这套框架目前更多是理论模型，尚未有生产级实现。但它的方向非常明确：Agentic AI的治理不能只依赖 API 网关或防火墙，必须深入到业务逻辑层面。对开发者而言，可以从中获得几点启示：

评估现有策略引擎：如果正在用Rego或Cedar管理AI代理，检查它们是否支持义务和豁免，否则考虑扩展或替换。
关注标准化进展：这篇论文很可能推动类似XACML的下一代策略语言标准，建议团队跟进。
从简单义务开始：即使框架复杂，也可以先在部分关键流程中实现“操作后通知”这类基本义务，积累经验。

AI代理正在从玩具走向生产系统，而治理是那个常常被忽略却至关重要的环节。这篇论文像一个路标，提醒我们：安全不仅要管住权限，还要管住行为与责任。

AI治理运行时治理道义逻辑LLM Agent策略引擎合规安全框架企业AI

分享

评论

0

暂无评论

成为第一个评论的人

探索更多

相似工具

GeoInfer

GeoInfer 是一款面向调查人员、记者、执法部门和安保专家的 AI 地理定位工具，通过分析照片中的建筑、地形、植被等视觉线索，快速推断拍摄地点。无需手动比对地图，支持批量处理，适用于开源情报（OSINT）调查、灾难响应和新闻事实核查。

Riskified

Riskified 是基于人工智能的电商欺诈防范与风险智能平台，帮助全球电商企业通过机器学习自动化审核交易，减少拒付损失并提升收入。平台实时分析用户行为，在安全与转化率之间取得平衡，已服务众多大型电商企业。

Tastewise

Tastewise 是一款专为食品品牌打造的消费者智能平台，结合 AI 与人类专家洞察，预测口味趋势、挖掘消费场景，帮助品牌加速产品创新与市场策略优化。覆盖实时数据、社交聆听和菜单分析，让食品企业决策更精准。

Fetcher

Fetcher是一款AI驱动的招聘工具，自动搜寻被动候选人，让招聘者从繁琐的搜集中解放，专注于候选人体验。支持多样化搜索，帮助团队更高效地发现并接触顶尖人才。

Kavout

Kavout 是一款金融AI工具，允许用户以自然语言提问的方式研究股票、ETF、加密货币和外汇。无需在多个平台间切换，直接询问“NVDA是否高估”或“寻找低负债、低于50美元的股息股”，即可获得财务数据与分析。

PixieBrix

PixieBrix 是一个低代码平台，让你快速构建并部署上下文感知的浏览器扩展，无缝集成 AI、API 和企业数据，支持规模化管理和自定义工作流。

开源项目

ai-market-maker: 开源 AI 对冲基金操作系统

ai-market-maker 是一个基于 TypeScript 的开源 AI 对冲基金操作系统，通过智能代理实现自动化交易决策。它支持多种策略配置和风险管理，适合量化交易开发者、金融科技爱好者以及希望探索 AI 赋能投资的研究者。项目活跃度较高，社区正在成长。

OpenAlice: 开源AI全品种交易助手

OpenAlice 是一个开源 AI 交易代理，覆盖股票、加密货币、大宗商品、外汇和宏观市场。它自动化从研究到仓位退出全流程，基于 TypeScript 构建，GitHub 星标超 5200，适合有编程能力的交易者。

openmed: 开源医疗 AI 框架

openmed 是一个专注于医疗健康领域的开源人工智能项目，基于 Python 开发，在 GitHub 上获得了超过 3400 星标。它旨在为医疗数据分析和 AI 模型部署提供基础工具，降低医疗 AI 的开发门槛，适合研究人员和开发者探索智能诊断、医学影像分析等场景。

AIRI: 自托管虚拟角色数字伴侣

AIRI 是一个面向自托管的虚拟角色 / 数字伴侣项目，具有语音、对话、游戏代理等能力

ValueCell: 社区驱动多智能体金融投研平台

ValueCell 是一个以社区为驱动的、多智能体系统平台，专注于金融领域的应用。它旨在将多个智能体（如市场分析、情绪分析、新闻分析、基本面分析等）组合协作，形成一种“智能投研团队”机制，为用户提供统一的投资组合管理、风险监控与策略开发。

Kronos: BTC/USDT 24小时概率预测

项目提供了一个 Web Demo，可以展示 BTC/USDT 在未来 24 小时的预测（概率 / 区间）效果