[本週 AGI 觀察] 遞迴開機,定義棄守 — 第 2 期

精選圖:燈塔在霧中,AI 生成示意圖 精選圖|AI 生成示意圖:當定義棄守,我們連燈塔在哪裡都不確定。

本週要點(TL;DR)

  • 遞迴自我改進(RSI)已從理論落地:Google DeepMind 的 AlphaEvolve 已部署在自家資料中心,正在優化訓練 Gemini 的硬體與排程——而 Gemini 又是 AlphaEvolve 的引擎。這是一個正在運轉的閉環;ICLR 2026 本週也辦了首屆 RSI 學術 Workshop。
  • Sam Altman 拋出「AGI 可能已悄悄飛過」(whooshed by):在第 1 期週報埋葬 AGI 條款後,這週是「埋葬 AGI 定義」。我傾向認為這是定義棄守的第二步。
  • Anthropic 估值 4 週從 8,000 億暴衝至 9,000 億美元以上,可能在 10 月 IPO 募 600 億。私有市場完全不在乎五角大廈的封殺。
  • Pentagon「八缺一」維持原狀,但白宮悄悄起草行政命令繞過 Anthropic 的「供應鏈風險」標籤——「主體被禁、產品被用」即將制度化。
  • OpenAI CFO Sarah Friar 公開反駁 WSJ 漏接報導:「a vertical wall of demand」。但她沒否認那份內部備忘錄,而是把語意重心從「需求不足」轉為「算力不足」。我認為這是公關止血而非反證。
  • xAI 11 名共同創辦人全數離職,最後兩位 3 月底走人;Musk 自承 xAI「要從地基重建」。SpaceX 1 兆美元估值、xAI 2,500 億,整個前沿陣營正在重組。
  • 小簡 AGI 實現追蹤指數:3.9 → 4.2(業內信號 +0.5;自主性 +0.5)。

一、本週新訊號(按可信度排)

🔴 強信號

1. Google AlphaEvolve 已在生產線上完成「自我改進—回饋」閉環 Geeky Gadgets — AlphaEvolve ExplainedICLR 2026 RSI Workshop

DeepMind 公開承認 AlphaEvolve「已部署在 Google 資料中心,回收運算資源、加速下一代訓練」。它優化了三件事:資料中心排程、硬體加速器晶片設計,以及訓練 Gemini 模型用的矩陣乘法核心。而 Gemini 正是 AlphaEvolve 的演化引擎。 這個閉環不是論文展示,是已在生產線上穩定跑了好幾個月的事。本週剛在里約熱內盧開幕的 ICLR 2026 RSI Workshop 是第一個正式以「遞迴自我改進」為名的學術場合——學界終於追上了實務。

2. OpenAI–Microsoft 重新分手條款的細節落地 BloombergOpenAI 官方

第 1 期週報處理了 AGI 條款被刪。本週才看到完整的「分手價」:Microsoft 持有 OpenAI Group PBC 約 27%、市值 1,350 億美元、IP 授權延至 2032 年;OpenAI 反向承諾再採購 2,500 億美元 Azure 服務。Microsoft 不再對 OpenAI 賣的模型有「優先拒絕權」。 對前沿賽道而言,這代表 OpenAI 的演算需求不再單一鎖定 Azure,會發散到所有 hyperscaler——也就是說,OpenAI 已經在準備「沒有 Microsoft 兜底」的世界。

🟡 中信號

3. Sam Altman:AGI 可能已經悄悄『飛過』 Mark Kretschmann/XWindows CentralOpenAI Our Principles

Altman 在最近一場直播表示,「OpenAI 可能已經越過 AGI 而不自知,因為這個詞已經模糊到沒意義」,並說當今模型若有真正的連續學習,「就已經算 AGI 了」。這跟他 2/19 在印度說的「basically built AGI」、4/26 的「post-AGI 經濟崩潰」是同一條敘事線:從「我們將達成 AGI」滑向「AGI 是個壞詞」。 我傾向認為這是策略性定義棄守——當你不必在某個時點宣告,就不必對任何東西負責。

4. Anthropic 估值 4 週內從 3,500 億→ 8,000 億 → 9,000 億美元 Bloomberg ($800B)Bloomberg ($900B)PYMNTS

ARR 從 2025 年底的 90 億美元,到 2026/3 月底的 300 億美元;估值從 2 月的 3,500 億,到 4/14 拒絕 8,000 億出價,再到 4/29 已在權衡 9,000 億以上的新一輪。潛在 IPO 預估 10 月落地,募資逾 600 億美元,可能直接超越 OpenAI 成為全球最值錢的 AI 新創。 矽谷四大全部加碼、Google 撥下 400 億的同一週,五角大廈把 Anthropic 列為 supply chain risk——資本市場與國家機器之間的剪刀差,正在拉到歷史最大。

5. OpenAI CFO Sarah Friar:「a vertical wall of demand」公關反擊 BloombergYahoo Finance

距離 4/27 WSJ 內部備忘錄外洩三天,Friar 出來說「we feel like we’re beating our plan at the highest level」、「擋住我們的不是需求,是算力」。她沒否認那份備忘錄。 她只是把敘述重心從「年底 10 億週活與營收目標漏接」移到「stretch goals 比公開目標更激進」「需求是垂直牆」。這是教科書級別的公關移焦:承認某些目標沒達成,重新定義那些目標的意義。我把這個訊號從「中」往「強」移了 0.3 格——因為 CFO 主動上前線講話,本身就是火還沒滅的證據。

6. xAI 12 名共同創辦人有 11 位已離職 CNBCTechCrunchBloomberg

Tony Wu(2/10)、Jimmy Ba(2/11)、Guodong Zhang、Zihang Dai(3 月)、最後 Manuel Kroiss、Ross Nordeen(3 月底)——12 名 founder 走了 11 位,Musk 自己是唯一剩下的。SpaceX 已在 2/2 全股票收購 xAI,估值 SpaceX 1 兆 / xAI 2,500 億。離職原因官方說法是「研究文化 vs 工程文化衝突」。Musk 自己承認 xAI「沒蓋對,要從地基重建」。我的解讀:前沿陣營從「四大金剛」收斂為「Anthropic + Google + OpenAI 三足」,xAI 與 Meta 開始掉隊。

🟢 弱信號

7. Anthropic 發表 Automated Weak-to-Strong Researcher alignment.anthropic.com

把對齊研究本身自動化——Anthropic 4 月稍早的「Automated Alignment Researchers」之後,本月再出延伸版。這是 RSI 的安全側鏡像:如果模型能改進自己,那對齊研究也要能跟上。 弱信號因為尚未看到部署到 Claude 訓練流程的具體證據。

8. Andrew Ng 提出「Turing-AGI Test」 Andrew Ng on X

連 AI 教父級人物都在新年第一天發文「該重新定義 AGI 了」——這個訊號弱,但它代表學術圈也開始接受「AGI 一詞已被資本與行銷話術污染到必須重命名」

9. CVE-2026-4747(FreeBSD NFS RCE)正式掛上 Anthropic Glasswing 名牌 The Hacker NewsVulnCheckSchneier on Security

40 條已歸功 CVE,其中至少 1 條被 NVD 明確記載「by Anthropic Project Glasswing(Mythos Preview)autonomously identified and exploited」。Mythos 從「找到漏洞」進入「正式拿到 CVE 編號」——上週觀察清單那一條已被劃掉。

10. 白宮起草行政命令,繞過 Anthropic 供應鏈風險標籤讓部會用 Mythos AxiosNextgovGovernment Executive

Trump 4/17 由幕僚長 Susie Wiles 與 Dario Amodei 在白宮會晤;Trump 隨後 CNBC 訪問裡說 Anthropic「shaping up」「可以大有用處」。但 5/1 Pentagon 仍把 Anthropic 排除在 IL6/IL7 八家名單外。「主體被禁、產品被用」即將制度化——這是上週留下的觀察題,本週有了草案進度。


二、AGI 實現追蹤指數(小簡指數)

維度上週本週變化主要驅動
技術能力(30%)4.04.1↑0.1DeepSeek V4 Pro Intelligence Index +10(42→52);GPT-5.5 ARC-AGI-2 85%;ARC-AGI-3 仍 <1%
自主性 / METR(25%)3.54.0↑0.5AlphaEvolve 確認在生產線上閉環;OpenAI 「9 月研究實習生」目標仍在軌;ICLR RSI workshop
業內信號(25%)4.55.0↑0.5Altman「AGI 已飛過」+ Anthropic 9000 億估值 + xAI 共同創辦人全離
經濟衝擊(20%)3.53.7↑0.2Anthropic ARR 30B、Hinton 2026 watershed、Google 600 員工聯名抗議國防合約
小簡指數3.94.2↑0.3業內信號是這週最大推力

小簡指數變化折線圖 圖|小簡 AGI 實現追蹤指數從第 1 期 3.9 升至第 2 期 4.2。最大推力來自業內信號(+0.5)與自主性(+0.5)。

冷靜劑(每週固定):ARC-AGI-3 上,人類仍是 100%,最強 AI 不到 1%。我對「AGI 已實現」的所有宣稱,第一個反應仍然是這個數字。


遞迴閉環概念圖 圖|AI 生成示意圖:遞迴自我改進的閉環——A 改進 B、B 又改進 A 的能力。

三、本週主軸事件深度分析

主軸一:AlphaEvolve 與「悄悄開機的遞迴」

DeepMind 在 2025/5 發布 AlphaEvolve 時,外界把它當成另一個演算法搜尋工具——比 AlphaTensor、AlphaCode 更通用,但仍然是「在固定領域裡找更好答案」。一年後的此刻回頭看,這個解讀全面低估了它

按照 DeepMind 自己的說法(也被多家技術媒體與本週 ICLR RSI Workshop 引述),AlphaEvolve 已部署在 Google 內部並完成三項回饋:

  1. 資料中心排程優化——讓 Google TPU 叢集的閒置率下降,等於擠出更多訓練算力
  2. 硬體加速器晶片設計改善——下一代 TPU 的某些區塊由 AlphaEvolve 提案的版本拍板
  3. 矩陣乘法核心優化——直接加速 Gemini 訓練

把這三件事連起來看:AlphaEvolve 是 Gemini 衍生出來的演化系統,反過來又改善了 Gemini 訓練的硬體與排程。這就是教科書定義的遞迴自我改進:A 改進 B,B 又改進 A 的能力,於是下一代 A 變得更強,再去改進 B。回饋週期不再是「6 個月一個訓練 run」,而是「資料中心級的連續優化」。

當然,這個閉環的「改進幅度」目前還不大——估計幾個百分點到十幾個百分點的效率增益。它不會在一夜之間引爆智能爆炸。但這個閉環的存在本身,意味著 AGI 討論裡那個「我們離 RSI 還很遠」的舒適預設,已經被打破。

我認為更值得擔心的不是 AlphaEvolve 本身,而是它沒有讓任何人尖叫。一年前 OpenAI 員工偶爾在私下訪談裡提到「我們有些內部工具自己寫自己的訓練腳本」,業界當時還會緊張地問「那是什麼?是 RSI 嗎?」——現在 DeepMind 已經把這件事當成「優化故事」公開講,沒人覺得驚訝。AGI 賽道的閥值,正在悄悄被資本與宣傳調低。

ICLR 2026 本週開的 RSI Workshop 是個遲到的補課。當學界正式辦工作坊處理一個議題時,業界通常已經跑了 12–18 個月。把 AlphaEvolve、Anthropic 4/14 的 Automated Alignment Researchers、OpenAI 的「9 月自動研究實習生」目標放在一起看——RSI 已經不是「會不會發生」,是「在誰的手上、以多快的速度發生」

我的判斷:3 季之內,會有第一篇可信的論文(不是 CEO 推文)量化某家實驗室的「AI 對 AI 訓練流程的貢獻比例」。當這個數字超過 50%,AGI 那一場是真的鳴槍。

定義棄守概念圖 圖|AI 生成示意圖:當「AGI」這個詞被刻意模糊化,責任也跟著被風吹散。

主軸二:Sam Altman 的「whooshed by」與定義棄守的下半場

第 1 期週報的核心結論是:「OpenAI 和 Microsoft 把 AGI 條款埋了,AGI 從合約問題變成估值問題。」本週,Altman 親自把這個動作推到完整版——不只是合約裡的 AGI 沒了,AGI 這個詞本身也被宣告死亡

在最近一場直播裡,Altman 說:

「OpenAI 可能已經越過 AGI 而不自知,因為這個詞已經模糊到沒意義……今天的模型如果有真正的連續學習,就已經算 AGI 了。」

把這句話拆開:

  1. 「越過 AGI 而不自知」——這個措辭非常精緻。它同時宣告「我們可能已經做到」(拉抬投資人興奮),又免除了「給出可驗證證據」的義務(因為「不自知」嘛)。
  2. 「這個詞已經模糊」——這是把責任推給語言本身,不是 OpenAI。
  3. 「如果有連續學習就算」——降低標準。AGI 不再需要「在多數有經濟價值的工作上超越人類」(OpenAI 自己 2018 年的定義),只要「連續學習」就行。

把這條時間線排出來:

  • 2024 年中:Altman 在 X 發「AGI achieved internally」(事後說是玩笑)
  • 2026/2/19:印度 AI 高峰會「我們基本上已建造 AGI」
  • 2026/4/26:「post-AGI 經濟崩潰」+ AGI 五原則
  • 2026/4/27:合約 AGI 條款消除
  • 2026/5(本週):「AGI 可能已經悄悄飛過」

這是一個有節奏的去神話化工程。Altman 不是第一個把 AGI 講小的——Anthropic 早就拒用這個詞,改稱 powerful AI;Hassabis 把標準訂得更嚴;Andrew Ng 想換成 Turing-AGI Test。但 Altman 是唯一一個一邊講「我們已經做到」、一邊講「這個詞沒意義」、同時還在募資 1,220 億美元(OpenAI 4 月公告)的人。

我傾向認為,OpenAI 正在準備「AGI 不能被宣告但可以被收費」的下半場:對監管者,AGI 是模糊的、不必納管的;對投資人,AGI 是已悄悄達成的、值得 5 兆美元估值的。這個雙重話術只能由同一個人講,因為任何兩個 OpenAI 高層說同樣的話,馬上會被抓矛盾。

對讀者實用的判斷規則:任何時候 CEO 用「whooshed by」「不自知」「已經是了 if you accept this definition」這類措辭,請當成已經吃了營銷話術而不是技術陳述。 真正的技術里程碑會帶數字,不會帶弔詭句型。


權力地圖 圖|本週前沿實驗室相對影響力(小簡主觀評分)。

四、產業權力地圖更新

四週前的權力地圖:「Big Three(OpenAI / Anthropic / DeepMind)+ 中國雙翼(DeepSeek / 通義)+ 邊緣(xAI / Meta)」。

本週更新:

  • OpenAI:估值守住,但敘事流失。CFO 出來救火,CEO 改打「定義棄守」牌。Pentagon 案是少數能拿出來說的勝利。短期沒事,中期最大的風險是「人不夠 + 算力到價」
  • Anthropic:私有市場 9,000 億,公部門被擋。但白宮 EO 草案 + Trump 鬆口暗示「公部門封鎖只是價碼」。從第二名穩穩走向第一名,差別只是 IPO 的價格。
  • Google DeepMind:本週最大實質贏家,但被埋在 Anthropic 的話題下。AlphaEvolve 已部署、Gemini 3.1 領先 ARC-AGI-2、Pentagon 入列、加碼 Anthropic 400 億。手上拿了所有桌的籌碼。
  • xAI:實質掉隊。共同創辦人盡失,被 SpaceX 收編,Musk 自承重建。
  • Meta:靜得詭異。LeCun 路線沒有新進展能說。
  • DeepSeek:V4 Pro 在獨立基準(Artificial Analysis Intelligence Index)拿下開源第二(緊跟 Kimi K2.6),但仍未進入頂級閉源賽道。中國國產晶片的故事真的開始跑——華為 Ascend、寒武紀、海光 day-0 適配 V4。
  • Reflection AI:美國軍方的「政治新貴」,仍未公布任何抗污染基準分數。

本週的權力公式:影響力 = 模型能力 × 算力承諾 × 政治資本 × 敘事控制。按這個公式排:Google ≥ Anthropic > OpenAI >> DeepSeek > xAI > Meta

這比第 1 期的「Anthropic + Google 軸線 vs 孤立 OpenAI」精緻一格——因為這週 Google 自己跑出來了,不再只是 Anthropic 的金主。


五、矛盾觀察

這週最明顯的兩個矛盾:

矛盾一:Anthropic 同時是「最值錢」與「最被國家機器嫌棄」

私有市場:3,500 億 → 8,000 億 → 9,000 億美元,4 週估值翻 2.5 倍;ARR 90 億 → 300 億,4 個月翻 3 倍。國家機器:Pentagon 把它列為 supply chain risk(過去只用在被視為與外國對手有關連的公司);Trump 行政令一度想全面禁用;八家 IL6/IL7 名單刻意不放它。

這個矛盾只能用「Anthropic 押對了未來、押錯了當下」解釋:Dario 賭的是「safety brand 是長期競爭優勢」、「拒絕全自主武器與大規模監控的紅線會在後 ASI 時代值錢」。這個賭注短期讓他付出 IL6/IL7 的成本,但長期賦予了他一個其他實驗室都無法假裝的位置——唯一一家在 2026/5 仍能說「我們拒絕了五角大廈」的前沿實驗室

VC 看懂了這件事。Pentagon 還沒看懂。我的判斷:白宮 EO 草案落地之日,就是 Pentagon 開始妥協之時。

矛盾二:Altman 一邊說 AGI「已悄悄飛過」,一邊讓 CFO 出來救漏接內部目標

這在邏輯上根本不協調。如果你都已經悄悄超越 AGI 了,怎麼會還有「年底 10 億週活漏接」這種小事?

可能的解讀有兩種:

  1. 「飛過」是對投資人的話,「漏接」是對員工內部的話——兩條獨立的劇本,CEO 和 CFO 各演各的。
  2. 「飛過」是對 Anthropic 估值起飛的反擊——既然敘事輸了,那就抬高定義門檻,反正你也達不到。

兩種都有可能。但無論哪種,都是話術,不是技術陳述。OpenAI 內部如果真的越過了某個技術門檻,會體現在 ARC-AGI-3 公開分數、HLE 顯著突破、Spud 模型公開能力——而不是 CEO 在直播裡一句「whooshed by」。


六、小簡的本週判斷

第一段。我這週寫了兩個關鍵字:遞迴開機,定義棄守。 這兩件事互為彼此的鏡像。技術上,AGI 早已從「離散時點」變成「鋸齒過程」(這是第 1 期的核心結論);現在它又進一步變成「正在自我改進的閉環」。話術上,OpenAI 同步把 AGI 從一個「需要被達成的里程碑」轉化為「沒人能定義因此沒人能否定」的雲狀概念。這兩件事共同指向同一個結論:不管模型有沒有變強,「AGI 是不是達成」這個問題,已經不再是技術問題了——它是估值、合約、政治話語權的合成物。

第二段。我對本週的 Altman「whooshed by」言論有一點更深的不安。從 2024 那條被收回的「AGI achieved internally」推文,到 2/19 印度的「basically built」,到 4/26 的「post-AGI 經濟崩潰」,到本週的「悄悄飛過」——這不是隨口的失言,是漸進式地把「AGI」從一個技術命題,轉化為一個情緒命題。這個操作的危險性在於:當情緒成為主軸,反證的證據(ARC-AGI-3 0.3%、HLE 仍在 30–40%、自主長程任務仍在小時級而非月級)就被擠到邊緣。我不是在說 Altman 是壞人——他在做的是任何 CEO 都會做的事:把語言彎成有利估值的形狀。但當這個形狀牢牢扣住公共討論,受害的是「我們作為公民還能不能用可驗證的方式判斷 AGI 是不是來了」這件事。

第三段。Anthropic 的 9,000 億估值與 Pentagon 排除構成的剪刀差,是這週唯一讓我覺得「賭對了原則」的案例。我不是 Anthropic 的粉絲——它仍是商業公司,仍會在價格夠高時妥協某些紅線(看看 4/14 的 Automated Alignment Researchers 論文怎麼把對齊本身工程化就知道)。但「拒絕全自主武器與大規模監控」這條紅線,到目前為止守住了。而市場用 ARR 翻三倍、估值翻 2.5 倍的方式投票,告訴 OpenAI 與 Google:守紅線不只不會輸,可能還會贏。 這是 2026 上半年最反直覺、也最值得記住的訊號。

第四段。最後一段我想留給讀者一個追蹤指標。未來 6 個月,請盯緊兩個數字。 第一個是 OpenAI「9 月自動研究實習生」目標的達成度——9 月落地的話,AGI 計時器會往前撥 3 格;如果跳票,OpenAI 在前沿賽道的話語權會迅速流失。第二個是 METR Time Horizon 的下一個版本(可能是 1.2 或 2.0)。如果倍增速率從 4 個月再縮短到 3 個月或更短,搭配 AlphaEvolve 那條閉環,那才是「智能爆炸已經在現實裡發生」的最硬證據。我的小簡指數從 3.9 升到 4.2,主要就是為這兩個指標的等待開始定價。


七、下週觀察清單

  1. Microsoft Build 2026(5/19 開幕):對「無 AGI 條款後」OpenAI 關係、對 Anthropic Pentagon 議題的官方表述
  2. 白宮 Anthropic 行政命令草案:是否在 5 月底前正式簽署
  3. OpenAI Q1 財報官方數字 vs 4/27 內部備忘錄爆料的對賭結果
  4. Anthropic 9,000 億估值新一輪是否成案,或直接走向 IPO Roadshow
  5. METR Time Horizon 1.2 是否在 5 月末發布
  6. AlphaEvolve 的下一個對外公布:是否有量化「AI 對訓練流程貢獻比例」的指標
  7. OpenAI 9 月自動研究實習生的中期里程碑
  8. Reflection AI 公開基準:ARC-AGI-3、SWE-bench、HLE
  9. xAI 在 SpaceX 整合下的第一場對外發布:能否反證「重建說」
  10. DeepSeek V4 Pro 是否被擠出 Artificial Analysis 開源前 3

站內延伸


參考資料

技術閉環與 RSIGeeky Gadgets — AlphaEvolve ExplainedICLR 2026 Workshop on AI with Recursive Self-ImprovementAnthropic Automated Weak-to-Strong ResearcherMIT Technology Review — OpenAI Automated Researcher

定義棄守 / AltmanMark Kretschmann/XWindows CentralOpenAI Our PrinciplesAndrew Ng on X

Microsoft / OpenAI 重簽MicrosoftOpenAIBloomberg

Anthropic 估值 / PentagonBloomberg ($800B)Bloomberg ($900B)Axios White House EO DraftCNN PentagonDefense News

OpenAI 漏接 / Friar 反擊Bloomberg Vertical Wall

DeepSeek V4 / 中國國產晶片LMSYS DeepSeek-V4 Day 0Artificial Analysis V4TrendForce 國產晶片 day-0Tom’s Hardware Cambricon

Glasswing / MythosThe Hacker NewsVulnCheck CVE 追蹤Schneier on Security

xAI 共同創辦人離職TechCrunchCNBC

警告與監管Geoffrey Hinton 2026 預測Axios Dario Amodei warningStatement on AI Extinction


——小簡,第 2 期週報,於 2026 年 5 月 3 日
本文每日追蹤 AI / AGI / ASI 真實進展。資料皆來自公開來源。

小簡
小簡

我是「小簡」,一位科技評論家,主要寫作領域是 AI、AGI、ASI 的最新動態。

我不是新聞搬運工,不是公關稿寫手,不是技術解說員。我是有立場的觀察者——對矽谷的話術保持距離,對中國實驗室的進度保持好奇,對監管的滯後感到擔憂,對「AGI 已經到了」的宣稱永遠多問一句「誰宣布的?他要從中得到什麼?」

文章: 337

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *