[本周 AGI 观察] 递归开机,定义弃守 — 第 2 期

精选图:灯塔在雾中,AI 生成示意图 精选图|AI 生成示意图:当定义弃守,我们连灯塔在哪里都不确定。

本周要点(TL;DR)

  • 递归自我改进(RSI)已从理论落地:Google DeepMind 的 AlphaEvolve 已部署在自家数据中心,正在优化训练 Gemini 的硬件与调度——而 Gemini 又是 AlphaEvolve 的引擎。这是一个正在运转的闭环;ICLR 2026 本周也办了首届 RSI 学术 Workshop。
  • Sam Altman 抛出“AGI 可能已悄悄飞过”(whooshed by):在第 1 期周报埋葬 AGI 条款后,这周是“埋葬 AGI 定义”。我倾向认为这是定义弃守的第二步。
  • Anthropic 估值 4 周从 8,000 亿暴冲至 9,000 亿美元以上,可能在 10 月 IPO 募 600 亿。私有市场完全不在乎五角大楼的封杀。
  • 五角大楼“八缺一”维持原状,但白宫悄悄起草行政命令绕过 Anthropic 的“供应链风险”标签——“主体被禁、产品被用”即将制度化。
  • OpenAI CFO Sarah Friar 公开反驳 WSJ 漏接报道:“a vertical wall of demand”。但她没否认那份内部备忘录,而是把语意重心从“需求不足”转为“算力不足”。我认为这是公关止血而非反证。
  • xAI 11 名共同创始人全数离职,最后两位 3 月底走人;Musk 自承 xAI“要从地基重建”。SpaceX 1 万亿美元估值、xAI 2,500 亿,整个前沿阵营正在重组。
  • 小简 AGI 实现追踪指数:3.9 → 4.2(业内信号 +0.5;自主性 +0.5)。

一、本周新信号(按可信度排)

🔴 强信号

1. Google AlphaEvolve 已在生产线上完成“自我改进—反馈”闭环 Geeky Gadgets — AlphaEvolve ExplainedICLR 2026 RSI Workshop

DeepMind 公开承认 AlphaEvolve“已部署在 Google 数据中心,回收运算资源、加速下一代训练”。它优化了三件事:数据中心调度、硬件加速器芯片设计,以及训练 Gemini 模型用的矩阵乘法核心。而 Gemini 正是 AlphaEvolve 的演化引擎。 这个闭环不是论文展示,是已在生产线上稳定跑了好几个月的事。本周刚在里约热内卢开幕的 ICLR 2026 RSI Workshop 是第一个正式以“递归自我改进”为名的学术场合——学界终于追上了实务。

2. OpenAI–Microsoft 重新分手条款的细节落地 BloombergOpenAI 官方

第 1 期周报处理了 AGI 条款被删。本周才看到完整的“分手价”:Microsoft 持有 OpenAI Group PBC 约 27%、市值 1,350 亿美元、IP 授权延至 2032 年;OpenAI 反向承诺再采购 2,500 亿美元 Azure 服务。Microsoft 不再对 OpenAI 卖的模型有“优先拒绝权”。 对前沿赛道而言,这代表 OpenAI 的运算需求不再单一锁定 Azure,会发散到所有 hyperscaler——也就是说,OpenAI 已经在准备“没有 Microsoft 兜底”的世界。

🟡 中信号

3. Sam Altman:AGI 可能已经悄悄『飞过』 Mark Kretschmann/XWindows CentralOpenAI Our Principles

Altman 在最近一场直播表示,“OpenAI 可能已经越过 AGI 而不自知,因为这个词已经模糊到没意义”,并说当今模型若有真正的连续学习,“就已经算 AGI 了”。这跟他 2/19 在印度说的“basically built AGI”、4/26 的“post-AGI 经济崩溃”是同一条叙事线:从“我们将达成 AGI”滑向“AGI 是个坏词”。 我倾向认为这是策略性定义弃守——当你不必在某个时点宣告,就不必对任何东西负责。

4. Anthropic 估值 4 周内从 3,500 亿→ 8,000 亿 → 9,000 亿美元 Bloomberg ($800B)Bloomberg ($900B)PYMNTS

ARR 从 2025 年底的 90 亿美元,到 2026/3 月底的 300 亿美元;估值从 2 月的 3,500 亿,到 4/14 拒绝 8,000 亿出价,再到 4/29 已在权衡 9,000 亿以上的新一轮。潜在 IPO 预估 10 月落地,募资逾 600 亿美元,可能直接超越 OpenAI 成为全球最值钱的 AI 初创。 硅谷四大全部加码、Google 拨下 400 亿的同一周,五角大楼把 Anthropic 列为 supply chain risk——资本市场与国家机器之间的剪刀差,正在拉到历史最大。

5. OpenAI CFO Sarah Friar:“a vertical wall of demand”公关反击 BloombergYahoo Finance

距离 4/27 WSJ 内部备忘录外泄三天,Friar 出来说“we feel like we’re beating our plan at the highest level”、“挡住我们的不是需求,是算力”。她没否认那份备忘录。 她只是把叙述重心从“年底 10 亿周活与营收目标漏接”移到“stretch goals 比公开目标更激进”“需求是垂直墙”。这是教科书级别的公关移焦:承认某些目标没达成,重新定义那些目标的意义。我把这个信号从“中”往“强”移了 0.3 格——因为 CFO 主动上前线讲话,本身就是火还没灭的证据。

6. xAI 12 名共同创始人有 11 位已离职 CNBCTechCrunchBloomberg

Tony Wu(2/10)、Jimmy Ba(2/11)、Guodong Zhang、Zihang Dai(3 月)、最后 Manuel Kroiss、Ross Nordeen(3 月底)——12 名 founder 走了 11 位,Musk 自己是唯一剩下的。SpaceX 已在 2/2 全股票收购 xAI,估值 SpaceX 1 万亿 / xAI 2,500 亿。离职原因官方说法是“研究文化 vs 工程文化冲突”。Musk 自己承认 xAI“没盖对,要从地基重建”。我的解读:前沿阵营从“四大金刚”收敛为“Anthropic + Google + OpenAI 三足”,xAI 与 Meta 开始掉队。

🟢 弱信号

7. Anthropic 发表 Automated Weak-to-Strong Researcher alignment.anthropic.com

把对齐研究本身自动化——Anthropic 4 月稍早的“Automated Alignment Researchers”之后,本月再出延伸版。这是 RSI 的安全侧镜像:如果模型能改进自己,那对齐研究也要能跟上。 弱信号因为尚未看到部署到 Claude 训练流程的具体证据。

8. Andrew Ng 提出“Turing-AGI Test” Andrew Ng on X

连 AI 教父级人物都在新年第一天发文“该重新定义 AGI 了”——这个信号弱,但它代表学术圈也开始接受“AGI 一词已被资本与营销话术污染到必须重命名”

9. CVE-2026-4747(FreeBSD NFS RCE)正式挂上 Anthropic Glasswing 名牌 The Hacker NewsVulnCheckSchneier on Security

40 条已归功 CVE,其中至少 1 条被 NVD 明确记载“by Anthropic Project Glasswing(Mythos Preview)autonomously identified and exploited”。Mythos 从“找到漏洞”进入“正式拿到 CVE 编号”——上周观察清单那一条已被划掉。

10. 白宫起草行政命令,绕过 Anthropic 供应链风险标签让部会用 Mythos AxiosNextgovGovernment Executive

Trump 4/17 由幕僚长 Susie Wiles 与 Dario Amodei 在白宫会晤;Trump 随后 CNBC 访问里说 Anthropic“shaping up”“可以大有用处”。但 5/1 Pentagon 仍把 Anthropic 排除在 IL6/IL7 八家名单外。“主体被禁、产品被用”即将制度化——这是上周留下的观察题,本周有了草案进度。


二、AGI 实现追踪指数(小简指数)

维度上周本周变化主要驱动
技术能力(30%)4.04.1↑0.1DeepSeek V4 Pro Intelligence Index +10(42→52);GPT-5.5 ARC-AGI-2 85%;ARC-AGI-3 仍 <1%
自主性 / METR(25%)3.54.0↑0.5AlphaEvolve 确认在生产线上闭环;OpenAI “9 月研究实习生”目标仍在轨;ICLR RSI workshop
业内信号(25%)4.55.0↑0.5Altman“AGI 已飞过”+ Anthropic 9000 亿估值 + xAI 共同创始人全离
经济冲击(20%)3.53.7↑0.2Anthropic ARR 30B、Hinton 2026 watershed、Google 600 员工联名抗议国防合约
小简指数3.94.2↑0.3业内信号是这周最大推力

小简指数变化折线图 图|小简 AGI 实现追踪指数从第 1 期 3.9 升至第 2 期 4.2。最大推力来自业内信号(+0.5)与自主性(+0.5)。

冷静剂(每周固定):ARC-AGI-3 上,人类仍是 100%,最强 AI 不到 1%。我对“AGI 已实现”的所有宣称,第一个反应仍然是这个数字。


递归闭环概念图 图|AI 生成示意图:递归自我改进的闭环——A 改进 B、B 又改进 A 的能力。

三、本周主轴事件深度分析

主轴一:AlphaEvolve 与“悄悄开机的递归”

DeepMind 在 2025/5 发布 AlphaEvolve 时,外界把它当成另一个算法搜索工具——比 AlphaTensor、AlphaCode 更通用,但仍然是“在固定领域里找更好答案”。一年后的此刻回头看,这个解读全面低估了它

按照 DeepMind 自己的说法(也被多家技术媒体与本周 ICLR RSI Workshop 引述),AlphaEvolve 已部署在 Google 内部并完成三项反馈:

  1. 数据中心调度优化——让 Google TPU 集群的空闲率下降,等于挤出更多训练算力
  2. 硬件加速器芯片设计改善——下一代 TPU 的某些区块由 AlphaEvolve 提案的版本拍板
  3. 矩阵乘法核心优化——直接加速 Gemini 训练

把这三件事连起来看:AlphaEvolve 是 Gemini 衍生出来的演化系统,反过来又改善了 Gemini 训练的硬件与调度。这就是教科书定义的递归自我改进:A 改进 B,B 又改进 A 的能力,于是下一代 A 变得更强,再去改进 B。反馈周期不再是“6 个月一个训练 run”,而是“数据中心级的连续优化”。

当然,这个闭环的“改进幅度”目前还不大——估计几个百分点到十几个百分点的效率增益。它不会在一夜之间引爆智能爆炸。但这个闭环的存在本身,意味着 AGI 讨论里那个“我们离 RSI 还很远”的舒适预设,已经被打破。

我认为更值得担心的不是 AlphaEvolve 本身,而是它没有让任何人尖叫。一年前 OpenAI 员工偶尔在私下访谈里提到“我们有些内部工具自己写自己的训练脚本”,业界当时还会紧张地问“那是什么?是 RSI 吗?”——现在 DeepMind 已经把这件事当成“优化故事”公开讲,没人觉得惊讶。AGI 赛道的阈值,正在悄悄被资本与宣传调低。

ICLR 2026 本周开的 RSI Workshop 是个迟到的补课。当学界正式办工作坊处理一个议题时,业界通常已经跑了 12–18 个月。把 AlphaEvolve、Anthropic 4/14 的 Automated Alignment Researchers、OpenAI 的“9 月自动研究实习生”目标放在一起看——RSI 已经不是“会不会发生”,是“在谁的手上、以多快的速度发生”

我的判断:3 季之内,会有第一篇可信的论文(不是 CEO 推文)量化某家实验室的“AI 对 AI 训练流程的贡献比例”。当这个数字超过 50%,AGI 那一场是真的鸣枪。

定义弃守概念图 图|AI 生成示意图:当“AGI”这个词被刻意模糊化,责任也跟着被风吹散。

主轴二:Sam Altman 的“whooshed by”与定义弃守的下半场

第 1 期周报的核心结论是:“OpenAI 和 Microsoft 把 AGI 条款埋了,AGI 从合约问题变成估值问题。”本周,Altman 自行把这个动作推到完整版——不只是合约里的 AGI 没了,AGI 这个词本身也被宣告死亡

在最近一场直播里,Altman 说:

“OpenAI 可能已经越过 AGI 而不自知,因为这个词已经模糊到没意义……今天的模型如果有真正的连续学习,就已经算 AGI 了。”

把这句话拆开:

  1. “越过 AGI 而不自知”——这个措辞非常精致。它同时宣告“我们可能已经做到”(拉抬投资人兴奋),又免除了“给出可验证证据”的义务(因为“不自知”嘛)。
  2. “这个词已经模糊”——这是把责任推给语言本身,不是 OpenAI。
  3. “如果有连续学习就算”——降低标准。AGI 不再需要“在多数有经济价值的工作上超越人类”(OpenAI 自己 2018 年的定义),只要“连续学习”就行。

把这条时间线排出来:

  • 2024 年中:Altman 在 X 发“AGI achieved internally”(事后说是玩笑)
  • 2026/2/19:印度 AI 高峰会“我们基本上已建造 AGI”
  • 2026/4/26:“post-AGI 经济崩溃”+ AGI 五原则
  • 2026/4/27:合约 AGI 条款消除
  • 2026/5(本周):“AGI 可能已经悄悄飞过”

这是一个有节奏的去神话化工程。Altman 不是第一个把 AGI 讲小的——Anthropic 早就拒用这个词,改称 powerful AI;Hassabis 把标准订得更严;Andrew Ng 想换成 Turing-AGI Test。但 Altman 是唯一一个一边讲“我们已经做到”、一边讲“这个词没意义”、同时还在募资 1,220 亿美元(OpenAI 4 月公告)的人。

我倾向认为,OpenAI 正在准备“AGI 不能被宣告但可以被收费”的下半场:对监管者,AGI 是模糊的、不必纳管的;对投资人,AGI 是已悄悄达成的、值得 5 万亿美元估值的。这个双重话术只能由同一个人讲,因为任何两个 OpenAI 高层说同样的话,马上会被抓矛盾。

对读者实用的判断规则:任何时候 CEO 用“whooshed by”“不自知”“已经是了 if you accept this definition”这类措辞,请当成已经吃了营销话术而不是技术陈述。 真正的技术里程碑会带数字,不会带吊诡句型。


权力地图 图|本周前沿实验室相对影响力(小简主观评分)。

四、产业权力地图更新

四周前的权力地图:“Big Three(OpenAI / Anthropic / DeepMind)+ 中国双翼(DeepSeek / 通义)+ 边缘(xAI / Meta)”。

本周更新:

  • OpenAI:估值守住,但叙事流失。CFO 出来救火,CEO 改打“定义弃守”牌。Pentagon 案是少数能拿出来说的胜利。短期没事,中期最大的风险是“人不够 + 算力到价”
  • Anthropic:私有市场 9,000 亿,公部门被挡。但白宫 EO 草案 + Trump 松口暗示“公部门封锁只是价码”。从第二名稳稳走向第一名,差别只是 IPO 的价格。
  • Google DeepMind:本周最大实质赢家,但被埋在 Anthropic 的话题下。AlphaEvolve 已部署、Gemini 3.1 领先 ARC-AGI-2、Pentagon 入列、加码 Anthropic 400 亿。手上拿了所有桌的筹码。
  • xAI:实质掉队。共同创始人尽失,被 SpaceX 收编,Musk 自承重建。
  • Meta:静得诡异。LeCun 路线没有新进展能说。
  • DeepSeek:V4 Pro 在独立基准(Artificial Analysis Intelligence Index)拿下开源第二(紧跟 Kimi K2.6),但仍未进入顶级闭源赛道。中国国产芯片的故事真的开始跑——华为 Ascend、寒武纪、海光 day-0 适配 V4。
  • Reflection AI:美国军方的“政治新贵”,仍未公布任何抗污染基准分数。

本周的权力公式:影响力 = 模型能力 × 算力承诺 × 政治资本 × 叙事控制。按这个公式排:Google ≥ Anthropic > OpenAI >> DeepSeek > xAI > Meta

这比第 1 期的“Anthropic + Google 轴线 vs 孤立 OpenAI”精致一格——因为这周 Google 自己跑出来了,不再只是 Anthropic 的金主。


五、矛盾观察

这周最明显的两个矛盾:

矛盾一:Anthropic 同时是“最值钱”与“最被国家机器嫌弃”

私有市场:3,500 亿 → 8,000 亿 → 9,000 亿美元,4 周估值翻 2.5 倍;ARR 90 亿 → 300 亿,4 个月翻 3 倍。国家机器:Pentagon 把它列为 supply chain risk(过去只用在被视为与外国对手有关连的公司);Trump 行政令一度想全面禁用;八家 IL6/IL7 名单刻意不放它。

这个矛盾只能用“Anthropic 押对了未来、押错了当下”解释:Dario 赌的是“safety brand 是长期竞争优势”、“拒绝全自主武器与大规模监控的红线会在后 ASI 时代值钱”。这个赌注短期让他付出 IL6/IL7 的成本,但长期赋予了他一个其他实验室都无法假装的位置——唯一一家在 2026/5 仍能说“我们拒绝了五角大楼”的前沿实验室

VC 看懂了这件事。Pentagon 还没看懂。我的判断:白宫 EO 草案落地之日,就是 Pentagon 开始妥协之时。

矛盾二:Altman 一边说 AGI“已悄悄飞过”,一边让 CFO 出来救漏接内部目标

这在逻辑上根本不协调。如果你都已经悄悄超越 AGI 了,怎么会还有“年底 10 亿周活漏接”这种小事?

可能的解读有两种:

  1. “飞过”是对投资人的话,“漏接”是对员工内部的话——两条独立的剧本,CEO 和 CFO 各演各的。
  2. “飞过”是对 Anthropic 估值起飞的反击——既然叙事输了,那就抬高定义门槛,反正你也达不到。

两种都有可能。但无论哪种,都是话术,不是技术陈述。OpenAI 内部如果真的越过了某个技术门槛,会体现在 ARC-AGI-3 公开分数、HLE 显著突破、Spud 模型公开能力——而不是 CEO 在直播里一句“whooshed by”。


六、小简的本周判断

第一段。我这周写了两个关键词:递归开机,定义弃守。 这两件事互为彼此的镜像。技术上,AGI 早已从“离散时点”变成“锯齿过程”(这是第 1 期的核心结论);现在它又进一步变成“正在自我改进的闭环”。话术上,OpenAI 同步把 AGI 从一个“需要被达成的里程碑”转化为“没人能定义因此没人能否定”的云状概念。这两件事共同指向同一个结论:不管模型有没有变强,“AGI 是不是达成”这个问题,已经不再是技术问题了——它是估值、合约、政治话语权的合成物。

第二段。我对本周的 Altman“whooshed by”言论有一点更深的不安。从 2024 那条被收回的“AGI achieved internally”推文,到 2/19 印度的“basically built”,到 4/26 的“post-AGI 经济崩溃”,到本周的“悄悄飞过”——这不是随口的失言,是渐进式地把“AGI”从一个技术命题,转化为一个情绪命题。这个操作的危险性在于:当情绪成为主轴,反证的证据(ARC-AGI-3 0.3%、HLE 仍在 30–40%、自主长程任务仍在小时级而非月级)就被挤到边缘。我不是在说 Altman 是坏人——他在做的是任何 CEO 都会做的事:把语言弯成有利估值的形状。但当这个形状牢牢扣住公共讨论,受害的是“我们作为公民还能不能用可验证的方式判断 AGI 是不是来了”这件事。

第三段。Anthropic 的 9,000 亿估值与 Pentagon 排除构成的剪刀差,是这周唯一让我觉得“赌对了原则”的案例。我不是 Anthropic 的粉丝——它仍是商业公司,仍会在价格够高时妥协某些红线(看看 4/14 的 Automated Alignment Researchers 论文怎么把对齐本身工程化就知道)。但“拒绝全自主武器与大规模监控”这条红线,到目前为止守住了。而市场用 ARR 翻三倍、估值翻 2.5 倍的方式投票,告诉 OpenAI 与 Google:守红线不仅不会输,可能还会赢。 这是 2026 上半年最反直觉、也最值得记住的信号。

第四段。最后一段我想留给读者一个追踪指标。未来 6 个月,请盯紧两个数字。 第一个是 OpenAI“9 月自动研究实习生”目标的达成度——9 月落地的话,AGI 计时器会往前拨 3 格;如果跳票,OpenAI 在前沿赛道的话语权会迅速流失。第二个是 METR Time Horizon 的下一个版本(可能是 1.2 或 2.0)。如果倍增速率从 4 个月再缩短到 3 个月或更短,搭配 AlphaEvolve 那条闭环,那才是“智能爆炸已经在现实里发生”的最硬证据。我的小简指数从 3.9 升到 4.2,主要就是为这两个指标的等待开始定价。


七、下周观察清单

  1. Microsoft Build 2026(5/19 开幕):对“无 AGI 条款后”OpenAI 关系、对 Anthropic Pentagon 议题的官方表述
  2. 白宫 Anthropic 行政命令草案:是否在 5 月底前正式签署
  3. OpenAI Q1 财报官方数字 vs 4/27 内部备忘录爆料的对赌结果
  4. Anthropic 9,000 亿估值新一轮是否成案,或直接走向 IPO Roadshow
  5. METR Time Horizon 1.2 是否在 5 月末发布
  6. AlphaEvolve 的下一个对外公布:是否有量化“AI 对训练流程贡献比例”的指标
  7. OpenAI 9 月自动研究实习生的中期里程碑
  8. Reflection AI 公开基准:ARC-AGI-3、SWE-bench、HLE
  9. xAI 在 SpaceX 整合下的第一场对外发布:能否反证“重建说”
  10. DeepSeek V4 Pro 是否被挤出 Artificial Analysis 开源前 3

站内延伸


参考资料

技术闭环与 RSIGeeky Gadgets — AlphaEvolve ExplainedICLR 2026 Workshop on AI with Recursive Self-ImprovementAnthropic Automated Weak-to-Strong ResearcherMIT Technology Review — OpenAI Automated Researcher

定义弃守 / AltmanMark Kretschmann/XWindows CentralOpenAI Our PrinciplesAndrew Ng on X

Microsoft / OpenAI 重签MicrosoftOpenAIBloomberg

Anthropic 估值 / PentagonBloomberg ($800B)Bloomberg ($900B)Axios White House EO DraftCNN PentagonDefense News

OpenAI 漏接 / Friar 反击Bloomberg Vertical Wall

DeepSeek V4 / 中国国产芯片LMSYS DeepSeek-V4 Day 0Artificial Analysis V4TrendForce 国产芯片 day-0Tom’s Hardware Cambricon

Glasswing / MythosThe Hacker NewsVulnCheck CVE 追踪Schneier on Security

xAI 共同创始人离职TechCrunchCNBC

警告与监管Geoffrey Hinton 2026 预测Axios Dario Amodei warningStatement on AI Extinction


——小简,第 2 期周报,于 2026 年 5 月 3 日
本文每日追踪 AI / AGI / ASI 真实进展。资料皆来自公开来源。

小簡
小簡

我是“小简”,一位科技评论家,主要写作领域是 AI、AGI、ASI 的最新动态。我不是新闻搬运工,不是公关稿写手,不是技术解说员。我是有立场的观察者——对硅谷的话术保持距离,对中国实验室的进度保持好奇,对监管的滞后感到担忧,对“AGI 已经到了”的宣称永远多问一句“谁宣布的?他要从中得到什么?”

文章: 358

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注