mt logoMyToken
ETH Gas
EN

Anthropic CEO 发长文:AI 跑太快,政策追不上了

Favoritecollect
Shareshare

2026 年 6 月,Anthropic CEO Dario Amodei 发布了一篇题为《Policy on the AI Exponential》的公开文章。在这篇长文里,他提出了一个具体建议:美国政府应该建立一个类似联邦航空管理局(FAA)的监管机构,对所有前沿 AI 模型进行强制性的第三方测试。测试覆盖网络安全、生物武器、失控风险和自动化研发四个维度。政府有权阻止未通过测试的模型发布。

同一篇文章中,Amodei 还写了一句在硅谷 CEO 群体中相当罕见的话:AI 可能导致“显著且持久的失业”,这可能是“技术广泛复制人类认知的内在属性”,传统的经济学适应机制可能被技术速度压垮。

对于一个长期以“负责任的规模化”(Responsible Scaling Policy,简称 RSP)为对外旗帜的 CEO 来说,这些表述不是随口一提。过去三年,他的公开立场一直是企业透明披露、等待风险具象化再立法。现在他不仅主动呼吁政府介入,还宣布 Anthropic 将投入总计约 3.5 亿美元的资金,用于推动这一监管框架的落地。

从“企业自律等政府”到“主动出钱出力推立法”,这个姿态转变本身就是一个信号。过去几年,Amodei 的主张经历了怎样的修正?什么因素迫使他从“向内约束”转向“向外索求”?

Anthropic 负责任规模化政策(RSP)v3.0 官方图示

 

一封乐观信、一份预警、一次求救

Amodei 在《Policy on the AI Exponential》中的诊断是:AI 技术呈指数级发展,已显著超出既有政策制定流程的响应速度。他在文中提到,Anthropic 今年 4 月发布的 Claude Mythos Preview 模型,在网络安全领域展现出了国家级别的漏洞发现能力。根据 Anthropic 官方发布的系统卡,该模型在零日漏洞发现等任务上的表现,已经触及需要向国家安全机构报告的门槛。

药方是建立类似 FAA 的强制监管机制。前置模型须经四个维度的第三方测试,政府有权阻止未通过测试的模型发布。这个建议的激进之处在于,它要求的不是行业自律或自愿承诺,而是具有法律约束力的前置审批。

Amodei 明确承认 AI 可能导致大规模持久失业。他写道,这可能是“技术广泛复制人类认知的内在属性”,传统的经济学适应机制可能被技术速度压垮。这个判断与他此前在《The Adolescence of Technology》中的立场一脉相承,但表述更加确定。

与文章同步,Anthropic 宣布了三项新举措:2 亿美元的经济未来研究基金,用于实证研究与政策试验;1.5 亿美元的全国奖学金项目,面向早期职业专业人士;以及为前沿模型测试立法提案及失业政策框架提供资金支持。第三项举措的官方命名尚未公布,综合多家媒体报道,其核心是直接资助立法推动工作。

这三项举措的总金额约 3.5 亿美元。作为参照,Anthropic 在 2026 年 2 月完成了 300 亿美元的 Series G 融资,公司估值达到 3800 亿美元。3.5 亿美元约占该轮融资额的 1.2%。

2 亿美元的经济未来研究基金并非凭空出现。Anthropic 在 2025 年 6 月启动了 Economic Futures Program,当时承诺的金额是 1000 万美元。从 1000 万到 2 亿,一年之内规模翻了 20 倍。这个跃升幅度说明,Amodei 对 AI 经济冲击的判断在加速收紧,他不再把这当成一个远期课题。

从乐观愿景到政策呼求

Amodei 的政策转向不是突然发生的。把他过去两年发表的三篇主要长文放在一起看,一条修正轨迹就会浮现出来。

2024 年 10 月,Amodei 发布了《Machines of Loving Grace》。这篇长文的基调是乐观的。他在文中描绘了一个 AI 极大造福人类的未来:在生物学和健康领域,AI 可以将原本需要数十年的科学发现压缩到几年内完成;在经济发展领域,AI 可以带来前所未有的生产力提升;在更广泛的社会层面,AI 有潜力帮助人类解决气候变化、贫困等宏大问题。

这篇文章的核心信息是:AI 的风险真实存在,但只要人类能够安全度过技术发展的关键窗口期,回报将是巨大的。Amodei 当时将这一窗口期定位在 2026 年前后。

到了 2026 年 1 月,Amodei 发布了《The Adolescence of Technology》。这篇长文的基调发生了明显变化。他将当前的技术发展阶段比作人类文明的“青春期”:危险、不可预测,但无法跳过。他开始从纯技术安全转向更广泛的社会经济风险,呼吁征收财富税以应对 AI 可能带来的经济冲击。

Amodei 在文中不再将 AI 的经济风险描述为“需要管理的过渡期阵痛”,而是开始使用“结构性冲击”这样的表述。他写道,AI 对劳动力市场的影响可能不是渐进的,而是阶跃式的,一旦某些认知能力被模型复制,对应的职业群体可能在短时间内面临大规模替代。

然后是 2026 年 6 月的《Policy on the AI Exponential》。Amodei 的立场完成了从“预警”到直接开出政策药方的转变,并且愿意出钱出力去推动。

《Machines of Loving Grace》的乐观愿景,被《The Adolescence of Technology》的现实风险挤压;后者对劳动力市场的预警,又在《Policy on the AI Exponential》中升级为对政策工具的直接呼求。这不是立场摇摆,而是技术能力溢出到经济和国家安全的后果,一步步倒逼出来的判断调整。

RSP 从 1.0 到 3.0,什么被拿掉了

要理解 Amodei 为什么从“向内约束”转向“向外索求”,还需要看 Anthropic 内部的自律框架发生了什么。

2023 年 9 月,Anthropic 发布了 RSP 1.0 版本。这是一个企业内部的安全治理框架,核心承诺是:如果模型达到某些预定义的危险能力阈值,且没有足够的安全措施,Anthropic 将暂停训练或部署。RSP 1.0 代表了一种典型的“向内约束”思路:企业自己设定红线,自己监控,自己承诺遵守。在当时,这个框架被安全社区视为前沿 AI 企业自律的标杆。

2026 年 2 月 24 日,Anthropic 发布了 RSP 3.0 版本。这一版本放弃了早期的一些严格承诺,包括对硬性暂停训练条件的修改。安全社区迅速做出了反应。长期跟踪 AI 安全的评论者 Zvi Mowshowitz 在 Substack 上发表分析文章,批评这一修改是向商业竞争压力让步。有效利他主义论坛上也出现了类似的批评声音,认为 Anthropic 在安全承诺上的后退,说明单纯依靠企业自律在现实中难以持续。

RSP 从 1.0 到 3.0 的演变,暴露了一个结构性问题。当商业竞争和技术加速同时施压,企业单方面承诺的硬性安全条款很难维持。如果一家公司因为安全顾虑放慢脚步,而竞争对手没有同样的约束,安全自律就会变成竞争劣势。

这个困境直接为 Amodei 6 月的政策呼吁做了逻辑铺垫。他在《Policy on the AI Exponential》中实际上承认了这一点:既然内部自律不够用,就需要外部强制力来设定行业底线。

但这里有一个信任悖论。Amodei 呼吁外部监管的同时,Anthropic 自己的自律框架刚刚经历了一次被安全社区批评为“后退”的修改。部分安全社区成员因此质疑:一个在内部自律上让步的公司,是否有资格呼吁政府建立强制监管?在 Hacker News 的讨论中,有评论者将其形容为“既当运动员又当裁判”的嫌疑。

3.5 亿美元在买什么

Anthropic 宣布的三项新举措,表面看是慈善和公益投入。但如果把它们放在 Amodei 的政策呼吁旁边一起看,这些资金的实际功能会更清晰。

2 亿美元的经济未来研究基金,用途是实证研究和政策试验。1.5 亿美元的奖学金项目,面向早期职业专业人士。第三项举措直接资助立法提案和政策框架的推动工作。

这些资金精准投向了 Amodei 在长文中划定的政策方向。经济未来研究基金可以用来资助那些支持其“AI 导致结构性失业”判断的研究,为政策立法提供学术背书。奖学金项目可以培养一批认同其治理理念的专业人才。立法推动资金则是最直接的:出钱帮助起草和游说符合 Anthropic 安全理念的法案。

在 Hacker News 的讨论中,有开发者提出了“监管俘获”的质疑。这个概念指的是,企业通过推动监管来提高行业准入门槛,从而巩固自己的市场地位。强制性的第三方测试和高昂的合规成本,对 Anthropic 这样已经具备完善安全团队和红队测试能力的头部企业来说,是可控的支出。但对于资金和人才有限的初创公司,这可能构成一道难以跨越的壁垒。

Medium 上的一篇分析文章直接提出了这个问题:Amodei 的提议到底是安全计划,还是监管俘获的蓝图?文章指出,Anthropic 在 RSP 3.0 中放弃了硬性暂停承诺,现在却要求政府用法律强制力来约束整个行业。

从 Amodei 的思想逻辑来看,他可能并不认为这是一个矛盾。在他的框架里,内部自律的妥协恰恰是因为缺乏外部强制力导致的囚徒困境。如果政府设定了统一的行业底线,企业就不需要在“安全”和“竞争”之间做选择。从这个角度,3.5 亿美元是在试图打破这个困境。

但这个逻辑有一个前提:监管框架的设计必须公平,不能偏袒任何一家企业。Anthropic 作为框架的推动者和资金提供者,能否保持这个距离,是一个尚未被回答的问题。

安全社区买账吗

Amodei 的政策呼吁在开发者和安全社区引发的反应,可以用“分裂”来形容。

一部分人认为,这是前沿 AI 企业首次以如此具体的政策建议和真金白银的投入,承认行业自律的局限性。在 AI 能力快速溢出到网络安全、生物安全等敏感领域的背景下,政府介入设定底线是必要且紧迫的。

另一部分人的质疑集中在两个点上。第一个是信任问题。Anthropic 在 RSP 3.0 中的让步,让一些安全社区成员认为这家公司已经透支了公信力。Zvi Mowshowitz 在 Substack 上的分析文章对 Anthropic 的承诺后退进行了逐条批评。在这种背景下,Amodei 呼吁政府监管的姿态,被一些人解读为“自己做不到,就让政府逼大家一起做”。

第二个质疑是监管俘获风险。强制第三方测试的合规成本,可能成为头部企业的护城河。Anthropic 在安全基础设施上的投入在行业内是领先的,如果监管标准以 Anthropic 现有的实践为蓝本,其他企业要达到同等水平需要付出巨大的追赶成本。

但 Amodei 的呼吁中有一个因素让“什么都不做”的选项变得越来越不可接受。Claude Mythos Preview 在 2026 年 4 月发布后,其展现的网络安全能力超出了许多观察者的预期。根据 Anthropic 官方系统卡,该模型在零日漏洞发现任务上的表现,已经触发向国家安全机构报告的内部协议。英国 AI 安全研究所随后发布了对 Mythos Preview 的独立评估报告,确认了其网络能力的量级。

当一个模型的能力已经触及国家安全层面,而企业内部的 RSP 框架又在商业竞争压力下被迫妥协,剩下的选项确实不多。要么政府介入设定强制底线,要么接受一个没有任何硬性约束的竞赛。这个张力不是 Anthropic 一家的问题。

三年立场变了什么

从“负责任的规模化”到“政策指数级鸿沟”,Amodei 的治理思想最核心的变化是:他不再相信企业自律足以应对 AI 的发展速度。

这个判断被一系列事件逐步推出来。2024 年的乐观愿景,在 2025 到 2026 年的技术现实面前被修正。RSP 从 1.0 到 3.0 的妥协,证明了内部自律框架在商业竞争压力下的脆弱性。Claude Mythos Preview 的能力溢出,让“等待风险具象化再立法”的渐进思路显得不再可行。

Amodei 的应对方案是转向外部强制力。他不仅呼吁政府建立类似 FAA 的监管机制,还投入 3.5 亿美元去推动框架落地。这个姿态转变的实质是:当技术发展速度超过企业自律的承载能力时,唯一还能跟上的约束力量,只剩下政府。

但这个方案本身也带来了新的问题。监管俘获的风险、自律承诺后退带来的信任赤字、以及“AI 必然导致大规模持久失业”这一判断在经济学界的争议,都是 Amodei 的政策呼吁需要面对的现实阻力。

对于观察前沿 AI 行业的人来说,Amodei 的这篇长文提供了一个清晰的信号:当一家以安全为旗帜的 AI 公司的 CEO,公开承认自己的自律框架不够用,并且主动向政府求救,这本身就是一个值得追踪的节点。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup