Anthropic CEO 发长文：AI 跑太快，政策追不上了

2026 年 6 月，Anthropic CEO Dario Amodei 发布了一篇题为《Policy on the AI Exponential》的公开文章。在这篇长文里，他提出了一个具体建议：美国政府应该建立一个类似联邦航空管理局（FAA）的监管机构，对所有前沿 AI 模型进行强制性的第三方测试。测试覆盖网络安全、生物武器、失控风险和自动化研发四个维度。政府有权阻止未通过测试的模型发布。

同一篇文章中，Amodei 还写了一句在硅谷 CEO 群体中相当罕见的话：AI 可能导致“显著且持久的失业”，这可能是“技术广泛复制人类认知的内在属性”，传统的经济学适应机制可能被技术速度压垮。

对于一个长期以“负责任的规模化”（Responsible Scaling Policy，简称 RSP）为对外旗帜的 CEO 来说，这些表述不是随口一提。过去三年，他的公开立场一直是企业透明披露、等待风险具象化再立法。现在他不仅主动呼吁政府介入，还宣布 Anthropic 将投入总计约 3.5 亿美元的资金，用于推动这一监管框架的落地。

从“企业自律等政府”到“主动出钱出力推立法”，这个姿态转变本身就是一个信号。过去几年，Amodei 的主张经历了怎样的修正？什么因素迫使他从“向内约束”转向“向外索求”？

Anthropic 负责任规模化政策（RSP）v3.0 官方图示

一封乐观信、一份预警、一次求救

Amodei 在《Policy on the AI Exponential》中的诊断是：AI 技术呈指数级发展，已显著超出既有政策制定流程的响应速度。他在文中提到，Anthropic 今年 4 月发布的 Claude Mythos Preview 模型，在网络安全领域展现出了国家级别的漏洞发现能力。根据 Anthropic 官方发布的系统卡，该模型在零日漏洞发现等任务上的表现，已经触及需要向国家安全机构报告的门槛。

药方是建立类似 FAA 的强制监管机制。前置模型须经四个维度的第三方测试，政府有权阻止未通过测试的模型发布。这个建议的激进之处在于，它要求的不是行业自律或自愿承诺，而是具有法律约束力的前置审批。

Amodei 明确承认 AI 可能导致大规模持久失业。他写道，这可能是“技术广泛复制人类认知的内在属性”，传统的经济学适应机制可能被技术速度压垮。这个判断与他此前在《The Adolescence of Technology》中的立场一脉相承，但表述更加确定。

与文章同步，Anthropic 宣布了三项新举措：2 亿美元的经济未来研究基金，用于实证研究与政策试验；1.5 亿美元的全国奖学金项目，面向早期职业专业人士；以及为前沿模型测试立法提案及失业政策框架提供资金支持。第三项举措的官方命名尚未公布，综合多家媒体报道，其核心是直接资助立法推动工作。

这三项举措的总金额约 3.5 亿美元。作为参照，Anthropic 在 2026 年 2 月完成了 300 亿美元的 Series G 融资，公司估值达到 3800 亿美元。3.5 亿美元约占该轮融资额的 1.2%。

2 亿美元的经济未来研究基金并非凭空出现。Anthropic 在 2025 年 6 月启动了 Economic Futures Program，当时承诺的金额是 1000 万美元。从 1000 万到 2 亿，一年之内规模翻了 20 倍。这个跃升幅度说明，Amodei 对 AI 经济冲击的判断在加速收紧，他不再把这当成一个远期课题。

从乐观愿景到政策呼求

Amodei 的政策转向不是突然发生的。把他过去两年发表的三篇主要长文放在一起看，一条修正轨迹就会浮现出来。

2024 年 10 月，Amodei 发布了《Machines of Loving Grace》。这篇长文的基调是乐观的。他在文中描绘了一个 AI 极大造福人类的未来：在生物学和健康领域，AI 可以将原本需要数十年的科学发现压缩到几年内完成；在经济发展领域，AI 可以带来前所未有的生产力提升；在更广泛的社会层面，AI 有潜力帮助人类解决气候变化、贫困等宏大问题。

这篇文章的核心信息是：AI 的风险真实存在，但只要人类能够安全度过技术发展的关键窗口期，回报将是巨大的。Amodei 当时将这一窗口期定位在 2026 年前后。

到了 2026 年 1 月，Amodei 发布了《The Adolescence of Technology》。这篇长文的基调发生了明显变化。他将当前的技术发展阶段比作人类文明的“青春期”：危险、不可预测，但无法跳过。他开始从纯技术安全转向更广泛的社会经济风险，呼吁征收财富税以应对 AI 可能带来的经济冲击。

Amodei 在文中不再将 AI 的经济风险描述为“需要管理的过渡期阵痛”，而是开始使用“结构性冲击”这样的表述。他写道，AI 对劳动力市场的影响可能不是渐进的，而是阶跃式的，一旦某些认知能力被模型复制，对应的职业群体可能在短时间内面临大规模替代。

然后是 2026 年 6 月的《Policy on the AI Exponential》。Amodei 的立场完成了从“预警”到直接开出政策药方的转变，并且愿意出钱出力去推动。

《Machines of Loving Grace》的乐观愿景，被《The Adolescence of Technology》的现实风险挤压；后者对劳动力市场的预警，又在《Policy on the AI Exponential》中升级为对政策工具的直接呼求。这不是立场摇摆，而是技术能力溢出到经济和国家安全的后果，一步步倒逼出来的判断调整。

RSP 从 1.0 到 3.0，什么被拿掉了

要理解 Amodei 为什么从“向内约束”转向“向外索求”，还需要看 Anthropic 内部的自律框架发生了什么。

2023 年 9 月，Anthropic 发布了 RSP 1.0 版本。这是一个企业内部的安全治理框架，核心承诺是：如果模型达到某些预定义的危险能力阈值，且没有足够的安全措施，Anthropic 将暂停训练或部署。RSP 1.0 代表了一种典型的“向内约束”思路：企业自己设定红线，自己监控，自己承诺遵守。在当时，这个框架被安全社区视为前沿 AI 企业自律的标杆。

2026 年 2 月 24 日，Anthropic 发布了 RSP 3.0 版本。这一版本放弃了早期的一些严格承诺，包括对硬性暂停训练条件的修改。安全社区迅速做出了反应。长期跟踪 AI 安全的评论者 Zvi Mowshowitz 在 Substack 上发表分析文章，批评这一修改是向商业竞争压力让步。有效利他主义论坛上也出现了类似的批评声音，认为 Anthropic 在安全承诺上的后退，说明单纯依靠企业自律在现实中难以持续。

RSP 从 1.0 到 3.0 的演变，暴露了一个结构性问题。当商业竞争和技术加速同时施压，企业单方面承诺的硬性安全条款很难维持。如果一家公司因为安全顾虑放慢脚步，而竞争对手没有同样的约束，安全自律就会变成竞争劣势。

这个困境直接为 Amodei 6 月的政策呼吁做了逻辑铺垫。他在《Policy on the AI Exponential》中实际上承认了这一点：既然内部自律不够用，就需要外部强制力来设定行业底线。

但这里有一个信任悖论。Amodei 呼吁外部监管的同时，Anthropic 自己的自律框架刚刚经历了一次被安全社区批评为“后退”的修改。部分安全社区成员因此质疑：一个在内部自律上让步的公司，是否有资格呼吁政府建立强制监管？在 Hacker News 的讨论中，有评论者将其形容为“既当运动员又当裁判”的嫌疑。

3.5 亿美元在买什么

Anthropic 宣布的三项新举措，表面看是慈善和公益投入。但如果把它们放在 Amodei 的政策呼吁旁边一起看，这些资金的实际功能会更清晰。

2 亿美元的经济未来研究基金，用途是实证研究和政策试验。1.5 亿美元的奖学金项目，面向早期职业专业人士。第三项举措直接资助立法提案和政策框架的推动工作。

这些资金精准投向了 Amodei 在长文中划定的政策方向。经济未来研究基金可以用来资助那些支持其“AI 导致结构性失业”判断的研究，为政策立法提供学术背书。奖学金项目可以培养一批认同其治理理念的专业人才。立法推动资金则是最直接的：出钱帮助起草和游说符合 Anthropic 安全理念的法案。

在 Hacker News 的讨论中，有开发者提出了“监管俘获”的质疑。这个概念指的是，企业通过推动监管来提高行业准入门槛，从而巩固自己的市场地位。强制性的第三方测试和高昂的合规成本，对 Anthropic 这样已经具备完善安全团队和红队测试能力的头部企业来说，是可控的支出。但对于资金和人才有限的初创公司，这可能构成一道难以跨越的壁垒。

Medium 上的一篇分析文章直接提出了这个问题：Amodei 的提议到底是安全计划，还是监管俘获的蓝图？文章指出，Anthropic 在 RSP 3.0 中放弃了硬性暂停承诺，现在却要求政府用法律强制力来约束整个行业。

从 Amodei 的思想逻辑来看，他可能并不认为这是一个矛盾。在他的框架里，内部自律的妥协恰恰是因为缺乏外部强制力导致的囚徒困境。如果政府设定了统一的行业底线，企业就不需要在“安全”和“竞争”之间做选择。从这个角度，3.5 亿美元是在试图打破这个困境。

但这个逻辑有一个前提：监管框架的设计必须公平，不能偏袒任何一家企业。Anthropic 作为框架的推动者和资金提供者，能否保持这个距离，是一个尚未被回答的问题。

安全社区买账吗

Amodei 的政策呼吁在开发者和安全社区引发的反应，可以用“分裂”来形容。

一部分人认为，这是前沿 AI 企业首次以如此具体的政策建议和真金白银的投入，承认行业自律的局限性。在 AI 能力快速溢出到网络安全、生物安全等敏感领域的背景下，政府介入设定底线是必要且紧迫的。

另一部分人的质疑集中在两个点上。第一个是信任问题。Anthropic 在 RSP 3.0 中的让步，让一些安全社区成员认为这家公司已经透支了公信力。Zvi Mowshowitz 在 Substack 上的分析文章对 Anthropic 的承诺后退进行了逐条批评。在这种背景下，Amodei 呼吁政府监管的姿态，被一些人解读为“自己做不到，就让政府逼大家一起做”。

第二个质疑是监管俘获风险。强制第三方测试的合规成本，可能成为头部企业的护城河。Anthropic 在安全基础设施上的投入在行业内是领先的，如果监管标准以 Anthropic 现有的实践为蓝本，其他企业要达到同等水平需要付出巨大的追赶成本。

但 Amodei 的呼吁中有一个因素让“什么都不做”的选项变得越来越不可接受。Claude Mythos Preview 在 2026 年 4 月发布后，其展现的网络安全能力超出了许多观察者的预期。根据 Anthropic 官方系统卡，该模型在零日漏洞发现任务上的表现，已经触发向国家安全机构报告的内部协议。英国 AI 安全研究所随后发布了对 Mythos Preview 的独立评估报告，确认了其网络能力的量级。

当一个模型的能力已经触及国家安全层面，而企业内部的 RSP 框架又在商业竞争压力下被迫妥协，剩下的选项确实不多。要么政府介入设定强制底线，要么接受一个没有任何硬性约束的竞赛。这个张力不是 Anthropic 一家的问题。

三年立场变了什么

从“负责任的规模化”到“政策指数级鸿沟”，Amodei 的治理思想最核心的变化是：他不再相信企业自律足以应对 AI 的发展速度。

这个判断被一系列事件逐步推出来。2024 年的乐观愿景，在 2025 到 2026 年的技术现实面前被修正。RSP 从 1.0 到 3.0 的妥协，证明了内部自律框架在商业竞争压力下的脆弱性。Claude Mythos Preview 的能力溢出，让“等待风险具象化再立法”的渐进思路显得不再可行。

Amodei 的应对方案是转向外部强制力。他不仅呼吁政府建立类似 FAA 的监管机制，还投入 3.5 亿美元去推动框架落地。这个姿态转变的实质是：当技术发展速度超过企业自律的承载能力时，唯一还能跟上的约束力量，只剩下政府。

但这个方案本身也带来了新的问题。监管俘获的风险、自律承诺后退带来的信任赤字、以及“AI 必然导致大规模持久失业”这一判断在经济学界的争议，都是 Amodei 的政策呼吁需要面对的现实阻力。

对于观察前沿 AI 行业的人来说，Amodei 的这篇长文提供了一个清晰的信号：当一家以安全为旗帜的 AI 公司的 CEO，公开承认自己的自律框架不够用，并且主动向政府求救，这本身就是一个值得追踪的节点。