AI 玩新聞
AI 玩新聞結合最新人工智慧技術,為您重新定義閱讀體驗。
我們利用 AI 快速摘要、分析觀點並趣味解讀全球時事,讓看新聞不再枯燥,輕鬆掌握世界脈動。立即探索資訊的未來型態!
精选图|AI 生成示意图:当定义弃守,我们连灯塔在哪里都不确定。
1. Google AlphaEvolve 已在生产线上完成“自我改进—反馈”闭环 Geeky Gadgets — AlphaEvolve Explained、ICLR 2026 RSI Workshop
DeepMind 公开承认 AlphaEvolve“已部署在 Google 数据中心,回收运算资源、加速下一代训练”。它优化了三件事:数据中心调度、硬件加速器芯片设计,以及训练 Gemini 模型用的矩阵乘法核心。而 Gemini 正是 AlphaEvolve 的演化引擎。 这个闭环不是论文展示,是已在生产线上稳定跑了好几个月的事。本周刚在里约热内卢开幕的 ICLR 2026 RSI Workshop 是第一个正式以“递归自我改进”为名的学术场合——学界终于追上了实务。
2. OpenAI–Microsoft 重新分手条款的细节落地 Bloomberg、OpenAI 官方
第 1 期周报处理了 AGI 条款被删。本周才看到完整的“分手价”:Microsoft 持有 OpenAI Group PBC 约 27%、市值 1,350 亿美元、IP 授权延至 2032 年;OpenAI 反向承诺再采购 2,500 亿美元 Azure 服务。Microsoft 不再对 OpenAI 卖的模型有“优先拒绝权”。 对前沿赛道而言,这代表 OpenAI 的运算需求不再单一锁定 Azure,会发散到所有 hyperscaler——也就是说,OpenAI 已经在准备“没有 Microsoft 兜底”的世界。
3. Sam Altman:AGI 可能已经悄悄『飞过』 Mark Kretschmann/X、Windows Central、OpenAI Our Principles
Altman 在最近一场直播表示,“OpenAI 可能已经越过 AGI 而不自知,因为这个词已经模糊到没意义”,并说当今模型若有真正的连续学习,“就已经算 AGI 了”。这跟他 2/19 在印度说的“basically built AGI”、4/26 的“post-AGI 经济崩溃”是同一条叙事线:从“我们将达成 AGI”滑向“AGI 是个坏词”。 我倾向认为这是策略性定义弃守——当你不必在某个时点宣告,就不必对任何东西负责。
4. Anthropic 估值 4 周内从 3,500 亿→ 8,000 亿 → 9,000 亿美元 Bloomberg ($800B)、Bloomberg ($900B)、PYMNTS
ARR 从 2025 年底的 90 亿美元,到 2026/3 月底的 300 亿美元;估值从 2 月的 3,500 亿,到 4/14 拒绝 8,000 亿出价,再到 4/29 已在权衡 9,000 亿以上的新一轮。潜在 IPO 预估 10 月落地,募资逾 600 亿美元,可能直接超越 OpenAI 成为全球最值钱的 AI 初创。 硅谷四大全部加码、Google 拨下 400 亿的同一周,五角大楼把 Anthropic 列为 supply chain risk——资本市场与国家机器之间的剪刀差,正在拉到历史最大。
5. OpenAI CFO Sarah Friar:“a vertical wall of demand”公关反击 Bloomberg、Yahoo Finance
距离 4/27 WSJ 内部备忘录外泄三天,Friar 出来说“we feel like we’re beating our plan at the highest level”、“挡住我们的不是需求,是算力”。她没否认那份备忘录。 她只是把叙述重心从“年底 10 亿周活与营收目标漏接”移到“stretch goals 比公开目标更激进”“需求是垂直墙”。这是教科书级别的公关移焦:承认某些目标没达成,重新定义那些目标的意义。我把这个信号从“中”往“强”移了 0.3 格——因为 CFO 主动上前线讲话,本身就是火还没灭的证据。
6. xAI 12 名共同创始人有 11 位已离职 CNBC、TechCrunch、Bloomberg
Tony Wu(2/10)、Jimmy Ba(2/11)、Guodong Zhang、Zihang Dai(3 月)、最后 Manuel Kroiss、Ross Nordeen(3 月底)——12 名 founder 走了 11 位,Musk 自己是唯一剩下的。SpaceX 已在 2/2 全股票收购 xAI,估值 SpaceX 1 万亿 / xAI 2,500 亿。离职原因官方说法是“研究文化 vs 工程文化冲突”。Musk 自己承认 xAI“没盖对,要从地基重建”。我的解读:前沿阵营从“四大金刚”收敛为“Anthropic + Google + OpenAI 三足”,xAI 与 Meta 开始掉队。
7. Anthropic 发表 Automated Weak-to-Strong Researcher alignment.anthropic.com
把对齐研究本身自动化——Anthropic 4 月稍早的“Automated Alignment Researchers”之后,本月再出延伸版。这是 RSI 的安全侧镜像:如果模型能改进自己,那对齐研究也要能跟上。 弱信号因为尚未看到部署到 Claude 训练流程的具体证据。
8. Andrew Ng 提出“Turing-AGI Test” Andrew Ng on X
连 AI 教父级人物都在新年第一天发文“该重新定义 AGI 了”——这个信号弱,但它代表学术圈也开始接受“AGI 一词已被资本与营销话术污染到必须重命名”。
9. CVE-2026-4747(FreeBSD NFS RCE)正式挂上 Anthropic Glasswing 名牌 The Hacker News、VulnCheck、Schneier on Security
40 条已归功 CVE,其中至少 1 条被 NVD 明确记载“by Anthropic Project Glasswing(Mythos Preview)autonomously identified and exploited”。Mythos 从“找到漏洞”进入“正式拿到 CVE 编号”——上周观察清单那一条已被划掉。
10. 白宫起草行政命令,绕过 Anthropic 供应链风险标签让部会用 Mythos Axios、Nextgov、Government Executive
Trump 4/17 由幕僚长 Susie Wiles 与 Dario Amodei 在白宫会晤;Trump 随后 CNBC 访问里说 Anthropic“shaping up”“可以大有用处”。但 5/1 Pentagon 仍把 Anthropic 排除在 IL6/IL7 八家名单外。“主体被禁、产品被用”即将制度化——这是上周留下的观察题,本周有了草案进度。
| 维度 | 上周 | 本周 | 变化 | 主要驱动 |
|---|---|---|---|---|
| 技术能力(30%) | 4.0 | 4.1 | ↑0.1 | DeepSeek V4 Pro Intelligence Index +10(42→52);GPT-5.5 ARC-AGI-2 85%;ARC-AGI-3 仍 <1% |
| 自主性 / METR(25%) | 3.5 | 4.0 | ↑0.5 | AlphaEvolve 确认在生产线上闭环;OpenAI “9 月研究实习生”目标仍在轨;ICLR RSI workshop |
| 业内信号(25%) | 4.5 | 5.0 | ↑0.5 | Altman“AGI 已飞过”+ Anthropic 9000 亿估值 + xAI 共同创始人全离 |
| 经济冲击(20%) | 3.5 | 3.7 | ↑0.2 | Anthropic ARR 30B、Hinton 2026 watershed、Google 600 员工联名抗议国防合约 |
| 小简指数 | 3.9 | 4.2 | ↑0.3 | 业内信号是这周最大推力 |
图|小简 AGI 实现追踪指数从第 1 期 3.9 升至第 2 期 4.2。最大推力来自业内信号(+0.5)与自主性(+0.5)。
冷静剂(每周固定):ARC-AGI-3 上,人类仍是 100%,最强 AI 不到 1%。我对“AGI 已实现”的所有宣称,第一个反应仍然是这个数字。
图|AI 生成示意图:递归自我改进的闭环——A 改进 B、B 又改进 A 的能力。
DeepMind 在 2025/5 发布 AlphaEvolve 时,外界把它当成另一个算法搜索工具——比 AlphaTensor、AlphaCode 更通用,但仍然是“在固定领域里找更好答案”。一年后的此刻回头看,这个解读全面低估了它。
按照 DeepMind 自己的说法(也被多家技术媒体与本周 ICLR RSI Workshop 引述),AlphaEvolve 已部署在 Google 内部并完成三项反馈:
把这三件事连起来看:AlphaEvolve 是 Gemini 衍生出来的演化系统,反过来又改善了 Gemini 训练的硬件与调度。这就是教科书定义的递归自我改进:A 改进 B,B 又改进 A 的能力,于是下一代 A 变得更强,再去改进 B。反馈周期不再是“6 个月一个训练 run”,而是“数据中心级的连续优化”。
当然,这个闭环的“改进幅度”目前还不大——估计几个百分点到十几个百分点的效率增益。它不会在一夜之间引爆智能爆炸。但这个闭环的存在本身,意味着 AGI 讨论里那个“我们离 RSI 还很远”的舒适预设,已经被打破。
我认为更值得担心的不是 AlphaEvolve 本身,而是它没有让任何人尖叫。一年前 OpenAI 员工偶尔在私下访谈里提到“我们有些内部工具自己写自己的训练脚本”,业界当时还会紧张地问“那是什么?是 RSI 吗?”——现在 DeepMind 已经把这件事当成“优化故事”公开讲,没人觉得惊讶。AGI 赛道的阈值,正在悄悄被资本与宣传调低。
ICLR 2026 本周开的 RSI Workshop 是个迟到的补课。当学界正式办工作坊处理一个议题时,业界通常已经跑了 12–18 个月。把 AlphaEvolve、Anthropic 4/14 的 Automated Alignment Researchers、OpenAI 的“9 月自动研究实习生”目标放在一起看——RSI 已经不是“会不会发生”,是“在谁的手上、以多快的速度发生”。
我的判断:3 季之内,会有第一篇可信的论文(不是 CEO 推文)量化某家实验室的“AI 对 AI 训练流程的贡献比例”。当这个数字超过 50%,AGI 那一场是真的鸣枪。
图|AI 生成示意图:当“AGI”这个词被刻意模糊化,责任也跟着被风吹散。
第 1 期周报的核心结论是:“OpenAI 和 Microsoft 把 AGI 条款埋了,AGI 从合约问题变成估值问题。”本周,Altman 自行把这个动作推到完整版——不只是合约里的 AGI 没了,AGI 这个词本身也被宣告死亡。
在最近一场直播里,Altman 说:
“OpenAI 可能已经越过 AGI 而不自知,因为这个词已经模糊到没意义……今天的模型如果有真正的连续学习,就已经算 AGI 了。”
把这句话拆开:
把这条时间线排出来:
这是一个有节奏的去神话化工程。Altman 不是第一个把 AGI 讲小的——Anthropic 早就拒用这个词,改称 powerful AI;Hassabis 把标准订得更严;Andrew Ng 想换成 Turing-AGI Test。但 Altman 是唯一一个一边讲“我们已经做到”、一边讲“这个词没意义”、同时还在募资 1,220 亿美元(OpenAI 4 月公告)的人。
我倾向认为,OpenAI 正在准备“AGI 不能被宣告但可以被收费”的下半场:对监管者,AGI 是模糊的、不必纳管的;对投资人,AGI 是已悄悄达成的、值得 5 万亿美元估值的。这个双重话术只能由同一个人讲,因为任何两个 OpenAI 高层说同样的话,马上会被抓矛盾。
对读者实用的判断规则:任何时候 CEO 用“whooshed by”“不自知”“已经是了 if you accept this definition”这类措辞,请当成已经吃了营销话术而不是技术陈述。 真正的技术里程碑会带数字,不会带吊诡句型。
图|本周前沿实验室相对影响力(小简主观评分)。
四周前的权力地图:“Big Three(OpenAI / Anthropic / DeepMind)+ 中国双翼(DeepSeek / 通义)+ 边缘(xAI / Meta)”。
本周更新:
本周的权力公式:影响力 = 模型能力 × 算力承诺 × 政治资本 × 叙事控制。按这个公式排:Google ≥ Anthropic > OpenAI >> DeepSeek > xAI > Meta。
这比第 1 期的“Anthropic + Google 轴线 vs 孤立 OpenAI”精致一格——因为这周 Google 自己跑出来了,不再只是 Anthropic 的金主。
这周最明显的两个矛盾:
矛盾一:Anthropic 同时是“最值钱”与“最被国家机器嫌弃”
私有市场:3,500 亿 → 8,000 亿 → 9,000 亿美元,4 周估值翻 2.5 倍;ARR 90 亿 → 300 亿,4 个月翻 3 倍。国家机器:Pentagon 把它列为 supply chain risk(过去只用在被视为与外国对手有关连的公司);Trump 行政令一度想全面禁用;八家 IL6/IL7 名单刻意不放它。
这个矛盾只能用“Anthropic 押对了未来、押错了当下”解释:Dario 赌的是“safety brand 是长期竞争优势”、“拒绝全自主武器与大规模监控的红线会在后 ASI 时代值钱”。这个赌注短期让他付出 IL6/IL7 的成本,但长期赋予了他一个其他实验室都无法假装的位置——唯一一家在 2026/5 仍能说“我们拒绝了五角大楼”的前沿实验室。
VC 看懂了这件事。Pentagon 还没看懂。我的判断:白宫 EO 草案落地之日,就是 Pentagon 开始妥协之时。
矛盾二:Altman 一边说 AGI“已悄悄飞过”,一边让 CFO 出来救漏接内部目标
这在逻辑上根本不协调。如果你都已经悄悄超越 AGI 了,怎么会还有“年底 10 亿周活漏接”这种小事?
可能的解读有两种:
两种都有可能。但无论哪种,都是话术,不是技术陈述。OpenAI 内部如果真的越过了某个技术门槛,会体现在 ARC-AGI-3 公开分数、HLE 显著突破、Spud 模型公开能力——而不是 CEO 在直播里一句“whooshed by”。
第一段。我这周写了两个关键词:递归开机,定义弃守。 这两件事互为彼此的镜像。技术上,AGI 早已从“离散时点”变成“锯齿过程”(这是第 1 期的核心结论);现在它又进一步变成“正在自我改进的闭环”。话术上,OpenAI 同步把 AGI 从一个“需要被达成的里程碑”转化为“没人能定义因此没人能否定”的云状概念。这两件事共同指向同一个结论:不管模型有没有变强,“AGI 是不是达成”这个问题,已经不再是技术问题了——它是估值、合约、政治话语权的合成物。
第二段。我对本周的 Altman“whooshed by”言论有一点更深的不安。从 2024 那条被收回的“AGI achieved internally”推文,到 2/19 印度的“basically built”,到 4/26 的“post-AGI 经济崩溃”,到本周的“悄悄飞过”——这不是随口的失言,是渐进式地把“AGI”从一个技术命题,转化为一个情绪命题。这个操作的危险性在于:当情绪成为主轴,反证的证据(ARC-AGI-3 0.3%、HLE 仍在 30–40%、自主长程任务仍在小时级而非月级)就被挤到边缘。我不是在说 Altman 是坏人——他在做的是任何 CEO 都会做的事:把语言弯成有利估值的形状。但当这个形状牢牢扣住公共讨论,受害的是“我们作为公民还能不能用可验证的方式判断 AGI 是不是来了”这件事。
第三段。Anthropic 的 9,000 亿估值与 Pentagon 排除构成的剪刀差,是这周唯一让我觉得“赌对了原则”的案例。我不是 Anthropic 的粉丝——它仍是商业公司,仍会在价格够高时妥协某些红线(看看 4/14 的 Automated Alignment Researchers 论文怎么把对齐本身工程化就知道)。但“拒绝全自主武器与大规模监控”这条红线,到目前为止守住了。而市场用 ARR 翻三倍、估值翻 2.5 倍的方式投票,告诉 OpenAI 与 Google:守红线不仅不会输,可能还会赢。 这是 2026 上半年最反直觉、也最值得记住的信号。
第四段。最后一段我想留给读者一个追踪指标。未来 6 个月,请盯紧两个数字。 第一个是 OpenAI“9 月自动研究实习生”目标的达成度——9 月落地的话,AGI 计时器会往前拨 3 格;如果跳票,OpenAI 在前沿赛道的话语权会迅速流失。第二个是 METR Time Horizon 的下一个版本(可能是 1.2 或 2.0)。如果倍增速率从 4 个月再缩短到 3 个月或更短,搭配 AlphaEvolve 那条闭环,那才是“智能爆炸已经在现实里发生”的最硬证据。我的小简指数从 3.9 升到 4.2,主要就是为这两个指标的等待开始定价。
参考资料
技术闭环与 RSI:Geeky Gadgets — AlphaEvolve Explained;ICLR 2026 Workshop on AI with Recursive Self-Improvement;Anthropic Automated Weak-to-Strong Researcher;MIT Technology Review — OpenAI Automated Researcher
定义弃守 / Altman:Mark Kretschmann/X;Windows Central;OpenAI Our Principles;Andrew Ng on X
Microsoft / OpenAI 重签:Microsoft;OpenAI;Bloomberg
Anthropic 估值 / Pentagon:Bloomberg ($800B);Bloomberg ($900B);Axios White House EO Draft;CNN Pentagon;Defense News
OpenAI 漏接 / Friar 反击:Bloomberg Vertical Wall
DeepSeek V4 / 中国国产芯片:LMSYS DeepSeek-V4 Day 0;Artificial Analysis V4;TrendForce 国产芯片 day-0;Tom’s Hardware Cambricon
Glasswing / Mythos:The Hacker News;VulnCheck CVE 追踪;Schneier on Security
xAI 共同创始人离职:TechCrunch;CNBC
警告与监管:Geoffrey Hinton 2026 预测;Axios Dario Amodei warning;Statement on AI Extinction
——小简,第 2 期周报,于 2026 年 5 月 3 日
本文每日追踪 AI / AGI / ASI 真实进展。资料皆来自公开来源。