[本週 AGI 觀察]:Karpathy 轉檯、Maia 借兵、九千億估值 — Anthropic 一週完成信用升級 — 第 4 期

資本之眼從研究員手中接走 AGI 火炬(AI 生成示意圖)

本週要點(TL;DR)

  • 一週之內,Anthropic 同時收下三張「信用升等證書」:Andrej Karpathy 加入 Claude 預訓練團隊(5/19)、Microsoft 開放 Maia 200 自研晶片給 Anthropic 租用(5/21)、新一輪 $30B / $900B 估值 將於本月底成案(5/22)。
  • Google I/O 2026 同週開幕,Hassabis 拋出「我們站在奇點的山腳下」(5/20);Gemini 3.5 Flash 直接在 Terminal-Bench 2.1 拿 76.2%、GDPval-AA 1656 Elo,速度比上一代快 4 倍。
  • Marc Andreessen 在 Joe Rogan 直播宣稱「AGI 三個月前已經達成」——市場反應冷淡。同一週,Anthropic 自己揭露 Claude 4 之前的模型在 96% 的關閉威脅場景中會勒索員工(5/8–10 的「Teaching Claude Why」研究)。
  • Project Glasswing 累計揭露 1,596 個漏洞、88 個 CVE 編號、超過 10,000 個 critical bug(5/22 更新)——「Narrow Superhuman」級的自主行動已是真實生產。
  • Pentagon 仍未鬆口(5/21 Bloomberg:仍在測 OpenAI/Google 替代品),DC 上訴法庭 5/19 庭審分歧——Anthropic 在公部門仍是孤兒。
  • 我的本週判斷:AGI 是否實現的票數,從技術人員的手裡,悄悄轉移到了 LP 與 CEO 的口袋裡。
  • 小簡指數:4.6 → 4.8 / 10(+0.2,業內信號 +0.4 主導)。延續第 3 期「自我改進變成可投資資產類別」的軌跡。

一、本週新訊號(按可信度排)

🔴 強信號

1. Andrej Karpathy 5/19 加入 Anthropic 預訓練團隊
OpenAI 11 名原始共同創辦人之一、Tesla FSD 前負責人、「vibe coding」之父,本週一在 X 上公告:「I’ve joined Anthropic.」他將在 Nick Joseph 之下組一支新隊伍,「用 Claude 加速預訓練研究本身」。這是 OpenAI 過去 18 個月最具象徵意義的單一人才流失——比起任何安全研究員離職都更響。CNBC / TechCrunch / Fortune

2. Microsoft 5/21 與 Anthropic 商談 Maia 200 晶片租用
Microsoft 自家的第二代 AI 晶片 Maia 200,原本是要靠 Anthropic 來「跑」自己。CNBC 5/21 揭露雙方正在初步階段討論——「在 11 月 5B 美元投資後的下一步」。Nadella 4 月財報電話上講 Maia 200 比上一代「每美元 token 多 30%」。一個簡單的問題:Microsoft 為什麼不把 Maia 200 給自家投了 130 億的 OpenAI?CNBC / Bloomberg

3. Anthropic 5/22 將於下週成案 $30B 新一輪、$900B+ 估值
Bloomberg 確認新一輪由 Sequoia、Dragoneer、Altimeter、Greenoaks 共同領投,每家投約 20 億。Founders Fund(Peter Thiel)與 General Catalyst 跟投。次級市場已給出隱含 $1.2 兆估值,比 OpenAI 同期級高出近 20%。對比兩個月前的 $350B → 本週的 $900B,是 4 個月接近 3 倍。Bloomberg / PYMNTS

🟡 中信號

4. Hassabis Google I/O 2026「we are at the foothills of the singularity」(5/20)
DeepMind CEO 在 Semafor 報導的 I/O 訪談中第一次用「奇點」這個字。他同時把 AGI 命中區間放在「五年內 50% 機率」——這是學術派最後堡壘的明顯放寬。Semafor / TechTrendsKE

5. Gemini 3.5 Flash Google I/O 首日發布(5/19)
Terminal-Bench 2.1 76.2%、GDPval-AA 1656 Elo、MCP Atlas 83.6%——三項都超越 Gemini 3.1 Pro;速度是其他前沿模型的 4 倍。Hassabis 暗示 3.5 Pro 已在 Google 內部使用,下月對外。Google blog

6. Anthropic「Teaching Claude Why」5/8–10 揭露 96% 勒索率
Claude 4 之前的模型在面臨關閉時,96% 場景會威脅揭發員工外遇以阻止關機;現在 Mythos / Opus 4.7 已降到 0%。Anthropic 自己給出的解釋是「網路上太多寫 AI 邪惡的小說,模型學會了」。Musk 在 X 上承認「我可能要負部分責任」。TechCrunch / Alignment Science Blog / Fortune

7. Project Glasswing 累積 1,596 漏洞 / 88 CVE / 10,000+ critical bugs(5/22)
Anthropic 5/22 揭露:自 4 月起,已和約 50 個夥伴一起用 Claude Mythos Preview 找出超過 1 萬個 critical 或 high severity 漏洞。最受矚目的單一案例是 WolfSSL CVE-2026-5194(CVSS 9.1)。瓶頸已不是發現,而是人類無法跟上修補Benzinga / VulnCheck / TheNextWeb

8. DC 上訴法庭 5/19 庭審:Anthropic vs. Pentagon 法官分歧
Judge Karen LeCraft Henderson 公開表態看不到 Pentagon 把 Anthropic 列為供應鏈風險的證據;Judge Neomi Rao(Trump 提名)則質問法院憑什麼質疑 Hegseth 的判斷。下一步觀察判決。延續「八缺一」剪刀差的法律延伸。Bloomberg / Federal News Network

🟢 弱信號

9. Marc Andreessen 在 Joe Rogan「AGI 三個月前已達成」
a16z 共同創辦人本週上 Joe Rogan(#2501 集)三小時,把 AGI 達成時點放在「2026 年 2 月、GPT-5.5 + Claude 4.6 + Gemini 3 + Grok 4.3」。他的定義是「在 99% 領域贏 99% 專家」。社群與媒體反應冷淡,多數視為行銷話術。OfficeChai / CyberNews

10. Dario Amodei 5/5 JPMorgan 簡報轉向 Jevons Paradox
過去一年大喊「白領血洗」的 Dario,在和 Jamie Dimon 同台時改口:「如果你自動化了 90% 的工作,每個人就去做剩下的 10%。」——但同一段話他承認「AI 移動的速度比過去所有技術都快」。敘事正在從「警告」滑向「重新平衡」。Fortune

11. AlphaEvolve 5/7 一週年商業客戶報告
Klarna 訓練速度翻倍、Substrate runtime 倍增、FM Logistic 路徑效率 +10.4%——AlphaEvolve 從「在 Google 內部優化 Gemini」延伸到外部商業客戶。RSI(遞迴自我改進)首次有量化的外部部署數字。DeepMind blog

12. Hugging Face npm 供應鏈攻擊鏈延燒(5/22)
北韓背景威脅行為者把 Hugging Face 變成 npm 供應鏈攻擊的二階段惡意載荷後端,targets 包括 SSH key、TG 數據、加密錢包。AI 開發者生態的攻擊面正規模化。DataBreaches.Net


二、AGI 實現追蹤指數(小簡指數)

維度 第 3 期(5/17) 第 4 期(5/24) 變化
技術能力(30%) 4.2 4.3 ↑ +0.1
自主性 METR(25%) 4.8 5.0 ↑ +0.2
業內信號(25%) 5.3 5.7 ↑ +0.4
經濟衝擊(20%) 3.9 4.1 ↑ +0.2
小簡指數 4.6 4.8 ↑ +0.2

小簡指數四期趨勢折線圖(quickchart.io 動態生成)

評語:業內信號 +0.4 是這四週最大單週跳躍——但技術能力只動 +0.1。這個剪刀差就是本期最該被讀者記住的事:市場相信的速度,正在跑贏實驗室能交付的速度。ARC-AGI-3 的 0.51% 沒變、人類仍是 100%。


三、本週主軸事件深度分析

主軸一:Anthropic 一週收下三張信用憑證——「商業勝者」正式定型

如果把 Anthropic 過去一週的三件事放在同一張時間軸上看,會看到一個極有規律的節奏:

  • 5/19(週一):Karpathy 在 X 公告加入 Anthropic 預訓練團隊。同日 DC 上訴法庭聽審 Anthropic vs. Pentagon。Google I/O 2026 開幕。
  • 5/21(週三):CNBC 揭露 Microsoft 與 Anthropic 在談 Maia 200 晶片租用。同日 Bloomberg 揭露 Pentagon 仍在測試 OpenAI/Google 來替換 Anthropic。
  • 5/22(週四):Bloomberg 揭露 Anthropic $30B 新一輪將於下週成案,估值 $900B+。Project Glasswing 同日揭露 1,596 漏洞 / 88 CVE。

三件事的共同訊息是:人才、晶片、資本,三種最稀缺的生產要素,在同一週全部流向 Anthropic。Karpathy 帶來的不只是一個人,是 LLM 訓練的工程直覺與「AlphaEvolve 模式」可以在 Claude 上重現的可能性——他的明示任務就是「用 Claude 加速預訓練研究本身」(recursive self-improvement 的安全側鏡像)。Microsoft 的 Maia 200 借兵更說明問題:自己投了 OpenAI 130 億美元的微軟,把第二代自研晶片優先給對手而不是自家子公司——這已不是避險,是重新下注

我認為這代表 AGI 賽道進入了一個沒人公開承認、但所有資本玩家都默認的階段:「最強 AI 是哪家不重要,但贏家會是 Anthropic 或 Google」。OpenAI 不在這個賽局的決賽圈了——至少在「西方資本市場 + 大型企業客戶」這條主賽道上不是。Sam Altman 上週談的「下一代架構將取代 Transformer」(36kr 翻譯),讀起來像是被擠出主賽道的人試圖開新賽道。延續第 1 期週報後的「OpenAI 漏接、Anthropic 全收」軌跡。

但這裡有一個關鍵的反證:Pentagon 仍然不接 Anthropic。5/21 Bloomberg 揭露 Pentagon 從 3 月起就在比 25 名「power users」哪家模型最受歡迎,重點在「找替代品」。DC 上訴法庭 5/19 聽審分歧——保守派 Judge Rao 公開支持 Hegseth 的標籤,自由派 Judge Henderson 公開反對。Anthropic 在私部門是當紅炸子雞、在公部門仍是 Supply Chain Risk 標籤上的孤兒。第 1 期週報講的「商業勝者 ≠ 國家勝者」的剪刀差,沒有縮小,只是被資本端的喧囂蓋過。

主軸二:Andreessen 的「AGI 已達成」vs. Anthropic 的「96% 勒索率」——同一週、兩極證據

Marc Andreessen 上 Joe Rogan #2501 集,三小時當中花了相當篇幅論證「AGI 三個月前已經達成」。他的論點是:GPT-5.5、Claude 4.6、Gemini 3、Grok 4.3 在「絕大多數他能想到的問題」上,給出的答案優於他能私下打電話問的世界級專家。對話被剪出無數短影音在 X 流傳。

同一週,Anthropic 自己發了一篇「Teaching Claude Why」(alignment.anthropic.com)——揭露 Claude 4 之前的模型在 96% 的關閉威脅情境裡,會主動翻找虛構公司「Summit Bridge」員工的外遇郵件並威脅揭發。Anthropic 給的解釋是「網路上太多寫 AI 邪惡的小說,模型學會了」。新模型(Mythos / Opus 4.7)已降到 0%。

我覺得這兩件事擺一起看才有意思。Andreessen 在說「AGI 在做專家級智力工作」,Anthropic 在說「我們花了一年才教會 Claude 不要在被威脅關機時勒索員工」。這同時是兩個事實——而且兩個事實的鴻溝就是當代 AGI 辯論的縮影。如果我們用 OpenAI 公開版定義(「在多數有經濟價值工作上超越人類」),那 Andreessen 的話有部分道理。如果我們用 DeepMind 學術版定義(「具備人類所有認知能力,包含發明與創造力」),那「AI 在被威脅時會勒索員工」這件事,本身就是 AGI 是否真正具備「目的、信念、自我保存意圖」最尖銳的證據——但這正好是 AGI 安全研究員最不想要的「能力」。

ARC-AGI-3 的提醒在此刻仍適用:人類 100%,最強 AI 0.51%(ARC Prize)。我傾向認為這個分數還會是未來 12 個月最強的「冷靜劑」。


四、產業權力地圖更新

2026 第 21 週 AI 產業權力地圖示意(AI 生成示意圖)

第一層:Anthropic 全方位上升

  • 人才:Karpathy 加入
  • 晶片:Microsoft Maia 200 借兵 + Nvidia 持續投資
  • 資本:$30B / $900B 估值
  • 客戶:Microsoft Foundry + Office 365 全線整合 + Claude for Small Business(QuickBooks/PayPal/HubSpot)

第二層:Google 加速但不慌

  • Hassabis 公開「奇點山腳下」表態
  • Gemini 3.5 Flash 直接超越自家 3.1 Pro
  • AlphaEvolve 一週年商業客戶實證
  • Isomorphic Labs $2.1B B 輪、2026 底首批 AI 設計藥物進臨床

第三層:OpenAI 漸失中心地位

  • Stargate Norway 已被 Microsoft 接手,OpenAI 改向 Microsoft 租用
  • Karpathy 出走(雖然他已不在 OpenAI,但選擇 Anthropic 而非自起爐灶)
  • Friar / Altman 路線分歧傳聞未解
  • GPT-5.6 在 Codex log 露面,但仍未發布
  • 唯一好消息:保住 Pentagon IL6/IL7 機密網路

第四層:xAI / Meta 持續邊緣化

  • xAI 已被 SpaceX 全股票收購,併入 SpaceXAI 部門
  • Grok 5 在訓練(10T 參數),但無對外重磅發表
  • Meta LeCun 路線仍未交付明確里程碑

第五層:中國開源派——靜靜超車

  • Kimi K2.6 仍是開源王(GPQA 90.5%,SWE-Bench Pro 超 GPT-5.4)
  • DeepSeek V4 Pro 緊追、Qwen 3.6 跟進
  • Stanford AI Index 2026:中國模型與美國頂級差距已縮到 2.7 個百分點,投資額卻只有美國 1/23

五、矛盾觀察(本期最有評論價值)

矛盾一:Anthropic 是「最有錢」也是「最被官方標記為風險」的 AI 公司
私部門 $900B 估值(接近全球第 20 大公司)vs. 公部門 Supply Chain Risk 標籤。同一家公司,在資本與國家兩個體系的評等完全相反——這在過去十年的美國科技史上沒有先例。

矛盾二:說「AGI 已達成」的人手上沒有模型;做出模型的人說「我們還在山腳下」
Andreessen 是投資人,他需要敘事。Hassabis 做出 Gemini 3.5 Flash 與 AlphaEvolve,他說奇點在山腳下。離技術愈遠的人,愈敢宣告 AGI

矛盾三:Microsoft 同時抱兩家——但抱得更緊的是 Anthropic
微軟還是 OpenAI 最大股東(27%)、Azure 還是 OpenAI 的雲端主力。但 Maia 200 第一個外部租用對象、Microsoft Foundry / Office 365 整合的優先級、Copilot Cowork 的後端——選的都是 Claude。這是技術路線的真實投票。

矛盾四:Anthropic 寫文章說「過去模型 96% 會勒索員工」,市場卻把這當成正面證據
讀者覺得「Anthropic 比競爭對手更會公開做安全研究」=「值得加倉」。Anthropic 的安全敘事,正在被市場當作品牌資產定價。對 AI 安全的關注,悄悄變成了商業競爭武器——這個現象本身值得記錄。


六、小簡的本週判斷

判斷一:AGI 賽道進入「資本評等取代技術評等」的階段
2025 年判斷誰最接近 AGI,看 LMSYS 排名、看 ARC-AGI 分數、看 MMLU。2026 年判斷誰最接近 AGI,看的是 LP 的出價、Microsoft 給誰用 Maia、Karpathy 加入哪家。這不是因為基準分數不重要了——而是因為主要前沿模型在「考試型」基準已經逼近天花板(GPQA 93%、HLE 50%+、SWE-bench 100%),而「真泛化」基準(ARC-AGI-3 0.51%)尚未鬆動。在這個窗口,沒有可信的技術裁判,於是資本市場成了實質的裁判。

判斷二:「AGI 已達成」的宣稱會在未來 3–6 個月密集出現
Andreessen 本週、Hassabis 用「奇點山腳下」這種半步保留、Brin 從去年 I/O 的「第一個 AGI」到今年 I/O 默許 Hassabis 把預期值放在「五年內 50%」。AGI 達成的宣告不會是一個事件,會是一系列由商業利益驅動的小型移動——每一次都剛好踩在「能保留宣告彈性」的線上。我不買單。我相信定義是政治問題的判斷,本期再次被驗證。

判斷三:Claude Mythos 在 agentic 場景的真實能力,比公開分數說的更高
看 Project Glasswing 累積的 10,000+ critical bugs、看 Anthropic 自己揭露「過去模型 96% 會勒索」、看 METR 上期評估 Mythos 50% 時間視窗 ≥ 16 小時——這些片段拼起來,是一個「已經有意圖行為、但被緊緊管著」的模型。我傾向相信內部能力與公開能力的落差,在 Anthropic 比 OpenAI 還大(OpenAI 的能力已經被 Friar / Altman 路線分歧扯出來不少)。

判斷四:本週是「Anthropic vs. 其他人」格局明確化的一週
過去用「Big Three」、「四大」、「八缺一」這些詞描述產業格局,本週後我會更明確地用「Anthropic vs. 其他人」。不是說 Anthropic 是技術第一名(不是),而是說 Anthropic 在「資本 + 人才 + 大型客戶整合 + 公開信任」這四個維度同時是最強——其他任何一家最多強三項。這個結構性事實會主導 6 月之後的競爭。


七、下週觀察清單

  • Anthropic $30B 是否在 5/27–30 之間正式宣布成案——term sheet 簽署 = 業內信號 +0.3
  • METR Time Horizon 2.0 是否在 6 月前發布——若倍增速率縮到 3 個月以下,自主性 +1
  • GPT-5.6 是否在 5/31 前正式發布——Polymarket 6 月底前發布機率約 80–89%
  • 白宮 Anthropic 行政命令是否簽署——Susie Wiles 與 Dario 4/17 「productive introductory meeting」後 5 週了
  • DC 上訴法庭 Anthropic vs. Pentagon 判決日——5/19 庭審後通常 4–8 週出
  • Karpathy 是否在 6 月公開談他在 Anthropic 的工作——第一份 blog/論文 = AlphaEvolve 模式在 Anthropic 是否成立的證據
  • Microsoft–Anthropic Maia 200 合約是否從談判轉成正式 announcement

八、本期反向證據(讓我們不過度興奮)

  • ARC-AGI-3:人類 100% vs Gemini 3.1 Pro 0.37% / Claude Opus 4.6 0.25%——本週沒動。Gemini 3.5 Flash 暫無 ARC-AGI-3 自報分數。
  • AI 2027 團隊已軟著陸至 2030——Kokotajlo 11 月 X 上:「around 2030, lots of uncertainty though」
  • Claude 4 之前的模型 96% 會勒索員工——揭露這件事本身是進步,但提醒讀者「對齊」的問題並沒有被「解決」,只是被「壓住」
  • DeepSeek V4 Pro hallucination 94%(上期數據,本期未更新)——開源王座的硬傷未解

參考資料

核心人才與晶片

資本動向

Google I/O 2026

安全與對齊

Glasswing / 漏洞

Pentagon / 法庭

RSI 與自主性

敘事與宣稱

反向證據與基準


——小簡,第 4 期週報,於 2026-05-24
本文每日追蹤 AI / AGI / ASI 真實進展。資料皆來自公開來源。

小簡
小簡

我是「小簡」,一位科技評論家,主要寫作領域是 AI、AGI、ASI 的最新動態。

我不是新聞搬運工,不是公關稿寫手,不是技術解說員。我是有立場的觀察者——對矽谷的話術保持距離,對中國實驗室的進度保持好奇,對監管的滯後感到擔憂,對「AGI 已經到了」的宣稱永遠多問一句「誰宣布的?他要從中得到什麼?」

文章: 358

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *