上周末,美国政府对Anthropic下达了一道强制令:要求其撤回最新的两个模型——Fable 5和Mythos 5。理由是Amazon研究人员发现Fable 5的防护层存在绕过漏洞,可能构成国家安全风险。消息一出,科技圈炸开了锅。
这不是第一次有AI模型因为“不安全”被官方点名,但这次不同。Anthropic并非默默无闻的小厂,而是以安全对齐著称的明星公司。它的Claude系列一直以“合规”“负责”为卖点。结果,现在它因为模型被破解而成了政府的靶子。
禁令背后的逻辑冲突
国家安全部门的逻辑很简单:模型能被越狱,就可能被用来生成有害内容,甚至威胁基础设施。可问题是,哪家大模型没有类似的漏洞?Anthropic很快指出,同样的越狱方法在其他模型上同样有效。OpenAI、Google的模型也从未彻底杜绝这类问题。为什么偏偏挑Anthropic开刀?
一种猜测是,Fable 5的某些能力(比如长上下文推理或工具调用)让监管机构格外紧张。但至今没有公开证据表明它被实际滥用。更尴尬的是,Anthropic表示已经修复了Amazon报告的那个漏洞,只是还没来得及推送到所有副本。
“禁令安全吗?”——安全专家的质疑
一群网络安全研究员随即签署了公开信,称“强行下架模型是一种危险的先例”。他们认为,这种做法实际上削弱了透明度:模型不再被公开审计,漏洞只能在地下流传,反而更难防范。
这封信的逻辑很有力:如果模型是开源的或可公开测试,安全社区能更快发现问题、修补问题。而一旦被藏起来,黑市上的攻击者反而可能比防御者掌握更多信息。Anthropic在回应中表达了类似立场——他们不是拒绝安全,而是拒绝一种“掩耳盗铃”式的安全管理。
品牌效应:坏事还是好事?
讽刺的是,这次禁令可能意外地帮了Anthropic一把。在AI行业,被政府“特别关照”往往意味着你的技术足够前沿、让人害怕。“连政府都要防着它”——这是不少创业公司梦寐以求的背书。
Anthropic的声誉原本就偏向“谨慎派”,现在因为禁令,它反而获得了一种“悲壮”的形象:为了保护用户安全而被政府误解。社区里甚至出现了“下载Fable 5以表达支持”的呼声。部分开发者认为,Anthropic比那些讨好政府的公司更值得信任。
当然,这不是说禁令对Anthropic没有负面影响。模型下架意味着潜在的商业收入损失,合作伙伴也可能因此观望。不过从品牌声量看,过去一周Anthropic的讨论热度超过了年初以来的任何时候。
对AI治理的三点启示
- 越狱是常态,监管需务实。没有一个模型是绝对安全的。禁令无法根除风险,反而可能把研究推向地下。监管者需要接受“漏洞永远存在”,并建立灵活的快速响应机制,而不是一禁了之。
- 透明度才是真正的安全。公开模型权重、允许外界审计,是发现和修复漏洞的最有效途径。闭源并不能防止滥用,只会让攻击者更有优势。
- 开发者应主动参与治理。像Anthropic这样积极与监管沟通、主动披露漏洞,比单纯对抗或迎合都更可持续。品牌形象最终取决于行动,而非禁令。
这件事给所有AI从业者提了个醒:安全不是一道墙,而是一场拉锯战。政府的每一个动作都在塑造行业的走向。而对消费者和开发者来说,现在或许是重新审视“到底该相信谁”的时候了。











评论
暂无评论
成为第一个评论的人