Anthropic遭禁: 政府禁令反成品牌助力？

Hannah Foster

2026年6月20日

original

美国以国家安全为由勒令Anthropic撤回Fable 5和Mythos 5模型，但安全专家和开源社区认为此举治标不治本，反而可能提升Anthropic的声誉和关注度。本文分析禁令背后的争议、Anthropic的回应，以及此事对AI治理的启示。

上周末，美国政府对Anthropic下达了一道强制令：要求其撤回最新的两个模型——Fable 5和Mythos 5。理由是Amazon研究人员发现Fable 5的防护层存在绕过漏洞，可能构成国家安全风险。消息一出，科技圈炸开了锅。

这不是第一次有AI模型因为“不安全”被官方点名，但这次不同。Anthropic并非默默无闻的小厂，而是以安全对齐著称的明星公司。它的Claude系列一直以“合规”“负责”为卖点。结果，现在它因为模型被破解而成了政府的靶子。

禁令背后的逻辑冲突

国家安全部门的逻辑很简单：模型能被越狱，就可能被用来生成有害内容，甚至威胁基础设施。可问题是，哪家大模型没有类似的漏洞？Anthropic很快指出，同样的越狱方法在其他模型上同样有效。OpenAI、Google的模型也从未彻底杜绝这类问题。为什么偏偏挑Anthropic开刀？

一种猜测是，Fable 5的某些能力（比如长上下文推理或工具调用）让监管机构格外紧张。但至今没有公开证据表明它被实际滥用。更尴尬的是，Anthropic表示已经修复了Amazon报告的那个漏洞，只是还没来得及推送到所有副本。

一群网络安全研究员随即签署了公开信，称“强行下架模型是一种危险的先例”。他们认为，这种做法实际上削弱了透明度：模型不再被公开审计，漏洞只能在地下流传，反而更难防范。

这封信的逻辑很有力：如果模型是开源的或可公开测试，安全社区能更快发现问题、修补问题。而一旦被藏起来，黑市上的攻击者反而可能比防御者掌握更多信息。Anthropic在回应中表达了类似立场——他们不是拒绝安全，而是拒绝一种“掩耳盗铃”式的安全管理。

讽刺的是，这次禁令可能意外地帮了Anthropic一把。在AI行业，被政府“特别关照”往往意味着你的技术足够前沿、让人害怕。“连政府都要防着它”——这是不少创业公司梦寐以求的背书。

Anthropic的声誉原本就偏向“谨慎派”，现在因为禁令，它反而获得了一种“悲壮”的形象：为了保护用户安全而被政府误解。社区里甚至出现了“下载Fable 5以表达支持”的呼声。部分开发者认为，Anthropic比那些讨好政府的公司更值得信任。

当然，这不是说禁令对Anthropic没有负面影响。模型下架意味着潜在的商业收入损失，合作伙伴也可能因此观望。不过从品牌声量看，过去一周Anthropic的讨论热度超过了年初以来的任何时候。

越狱是常态，监管需务实。没有一个模型是绝对安全的。禁令无法根除风险，反而可能把研究推向地下。监管者需要接受“漏洞永远存在”，并建立灵活的快速响应机制，而不是一禁了之。
透明度才是真正的安全。公开模型权重、允许外界审计，是发现和修复漏洞的最有效途径。闭源并不能防止滥用，只会让攻击者更有优势。
开发者应主动参与治理。像Anthropic这样积极与监管沟通、主动披露漏洞，比单纯对抗或迎合都更可持续。品牌形象最终取决于行动，而非禁令。

这件事给所有AI从业者提了个醒：安全不是一道墙，而是一场拉锯战。政府的每一个动作都在塑造行业的走向。而对消费者和开发者来说，现在或许是重新审视“到底该相信谁”的时候了。

AI安全Anthropic美国政府模型禁令Claude越狱攻击开源安全政策影响品牌声誉AI治理