2026-06-14 — DeepMind 千萬美元多智能體安全基金、Anthropic Fable 5 遭美政府強制暫停、逆向工程揭露 Metal 4.1 FP8 矩陣運算走著色器核心

Google DeepMind 聯手多機構設立千萬美元研究基金，聚焦多智能體 AI 安全

Google DeepMind · 2026-06-11

Google DeepMind、Schmidt Sciences、Cooperative AI Foundation、ARIA 及 Google.org 於 2026 年 6 月 11 日宣布，共同設立總額 1000 萬美元的研究資助計畫，目標是系統性解決多個 AI 代理相互交互時所產生的安全挑戰。申請截止日為 2026 年 8 月 8 日，獲獎結果預計於秋季公布，申請者須透過 Schmidt Sciences 的 smapply.io 平台提交。

背景：單一模型評估已不足夠

現有的 AI 安全評估框架主要針對單一模型在隔離環境中的表現，卻難以捕捉來自不同機構的多個代理相互溝通時所產生的「湧現行為」（emergent behaviors）。隨著數百萬個獨立代理開始在數位環境中交互，潛在的集體性風險已超越現有框架的應對能力。DeepMind 在公告中指出，「沒有任何單一實驗室能獨力解決多智能體安全問題」，呼籲全球學術界與獨立研究者積極參與。

四大優先研究領域

沙箱與測試平台：建立可重現的多智能體互動評估環境
代理網路特性分析：理解代理群體的集體能力與行為模式
安全基礎設施與協定：強化代理間通訊的安全性與可信度
監控與監督方法：為已部署的大規模代理族群建立有效的監督機制

本次資助計畫同時參考了近期探討「AI 代理陷阱」（AI Agent Traps）的研究，這類研究分析了對抗性環境中代理系統的潛在漏洞。多機構聯合出資的結構設計，也呼應了跨組織合作才能覆蓋多元代理生態的核心主張。

原始來源：Google DeepMind Blog

美國政府以國家安全為由強制暫停 Fable 5 與 Mythos 5，Anthropic 依令執行但公開表達異議

Anthropic · 2026-06-12

美國政府發布出口管制指令，要求 Anthropic 暫停 Fable 5 與 Mythos 5 對所有使用者（包含外國公民）的存取權限。Anthropic 於 2026 年 6 月 12 日發表聲明，表示遵從法律指令，但同時對此決定提出反駁。Anthropic 其餘所有模型不受本次指令影響。

原本的問題：越獄技術引發管制

政府指令中提及當局掌握「一種繞過 Fable 5 安全機制的越獄方法」，但未披露技術細節。Anthropic 自行檢視後認定，該技術利用的是「少數已知的輕微漏洞」，且類似能力同樣存在於其他公開可用的模型中。公司警告，若以此為標準套用於業界整體，將「實質上使所有新模型部署停擺」。

採用的方法：縱深防禦策略

Fable 5 與 Mythos 5 上線前已部署多層安全措施，包含強化護欄、與政府及第三方合作進行數千小時的紅隊測試，以及完整的行為監控機制。Mythos 級模型另設有 30 天資料留存期，以支援事後稽核。Fable 5 具備三道主要安全分類器，分別針對網路安全、生物化學及模型蒸餾風險，違規時自動回退至 Opus 4.8。

實際效果與後續立場

此次暫停對開發者與企業客戶的部署計畫造成直接衝擊，兩款模型定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元，是 Anthropic 的旗艦收費方案。Anthropic 呼籲建立以技術事實為基礎、具法律效力的透明審查程序，反對以行政指令取代公開的安全評估機制，並強調現行程序缺乏法定依據與充分的技術論據。

原始來源：Anthropic News · Fable 5 / Mythos 5 發布公告

逆向工程 Apple M4 Max GPU：Metal 4.1 的 FP8 矩陣運算根本不走專用硬體

arXiv · 2026-06-11

研究者 Ramchand Kumaresan 於 arXiv:2606.12765（2026 年 6 月 11 日）發表論文，透過自建微基準測試框架 Rigel 對 Apple Metal 4.1 的張量運算路徑進行逆向工程，揭露 M4 Max GPU 上的 FP8 矩陣乘法（fp8 E4M3 matmul2d）並非走專用矩陣計算單元，而是完全在著色器核心（shader cores）上模擬執行。程式碼以 MIT 授權釋出，附帶可重現的 CSV 測試資料。

背景：Metal 4.1 的不透明張量設計

Apple 的 Metal 4.1 框架提供 matmul2d API，對外宣稱支援 FP8 張量運算，但內部執行路徑從未公開文件化。機器學習框架開發者與效能優化工程師長期缺乏足夠資訊，無法判斷此 API 是否真正利用了 M4 Max 的專屬矩陣硬體或 Neural Engine。Rigel 正是為填補這一資訊空白而設計的實驗性逆向工程框架，共回收了 11 項先前未記載的硬體行為。

核心發現：FP8 僅是記憶體優化，非算術加速

論文的核心結論是：fp8 matmul2d 的吞吐量僅為 FP16 的 0.94 倍，儘管 FP8 讀取的運算元位元組數只有 FP16 的一半。這意味著 FP8 在此路徑上的作用是減少記憶體帶寬佔用，而非提升算術吞吐，功能性質更接近一種記憶體壓縮格式。研究同時確認累加運算在 ≥FP32 精度下進行，並成功還原了不透明的 8×8 cooperative_tensor 片段（fragment）記憶體排列方式。

規格細節與實際優化效果

在實際應用層面，論文提出了手動融合的 GEMM + bias + GELU 核心，在快取駐留（cache-resident）場景下相較基線可獲得 +6.5–12.9% 的效能提升。這一結果說明，即便底層硬體路徑不如預期，透過充分了解實際執行特性仍可獲得有意義的優化空間，對以 Apple Silicon 為目標平台的推論框架開發者具有直接參考價值。

原始來源：arXiv:2606.12765

End of article