AI 前沿 2026 年 6 月 14 日

2026-06-14 — DeepMind 千萬美元多智能體安全基金、Anthropic Fable 5 遭美政府強制暫停、逆向工程揭露 Metal 4.1 FP8 矩陣運算走著色器核心

primary=https://deepmind.google/blog/investing-in-multi-agent-ai-safety-research/ primary=https://www.anthropic.com/news/fable-mythos-access primary=https://www.anthropic.com/news/claude-fable-5-mythos-5 primary=https://arxiv.org/abs/2606.12765

Google DeepMind 聯手多機構設立千萬美元研究基金,聚焦多智能體 AI 安全

Google DeepMind · 2026-06-11

Google DeepMind、Schmidt Sciences、Cooperative AI Foundation、ARIA 及 Google.org 於 2026 年 6 月 11 日宣布,共同設立總額 1000 萬美元的研究資助計畫,目標是系統性解決多個 AI 代理相互交互時所產生的安全挑戰。申請截止日為 2026 年 8 月 8 日,獲獎結果預計於秋季公布,申請者須透過 Schmidt Sciences 的 smapply.io 平台提交。

背景:單一模型評估已不足夠

現有的 AI 安全評估框架主要針對單一模型在隔離環境中的表現,卻難以捕捉來自不同機構的多個代理相互溝通時所產生的「湧現行為」(emergent behaviors)。隨著數百萬個獨立代理開始在數位環境中交互,潛在的集體性風險已超越現有框架的應對能力。DeepMind 在公告中指出,「沒有任何單一實驗室能獨力解決多智能體安全問題」,呼籲全球學術界與獨立研究者積極參與。

四大優先研究領域

  • 沙箱與測試平台:建立可重現的多智能體互動評估環境
  • 代理網路特性分析:理解代理群體的集體能力與行為模式
  • 安全基礎設施與協定:強化代理間通訊的安全性與可信度
  • 監控與監督方法:為已部署的大規模代理族群建立有效的監督機制

本次資助計畫同時參考了近期探討「AI 代理陷阱」(AI Agent Traps)的研究,這類研究分析了對抗性環境中代理系統的潛在漏洞。多機構聯合出資的結構設計,也呼應了跨組織合作才能覆蓋多元代理生態的核心主張。

原始來源:Google DeepMind Blog


美國政府以國家安全為由強制暫停 Fable 5 與 Mythos 5,Anthropic 依令執行但公開表達異議

Anthropic · 2026-06-12

美國政府發布出口管制指令,要求 Anthropic 暫停 Fable 5 與 Mythos 5 對所有使用者(包含外國公民)的存取權限。Anthropic 於 2026 年 6 月 12 日發表聲明,表示遵從法律指令,但同時對此決定提出反駁。Anthropic 其餘所有模型不受本次指令影響。

原本的問題:越獄技術引發管制

政府指令中提及當局掌握「一種繞過 Fable 5 安全機制的越獄方法」,但未披露技術細節。Anthropic 自行檢視後認定,該技術利用的是「少數已知的輕微漏洞」,且類似能力同樣存在於其他公開可用的模型中。公司警告,若以此為標準套用於業界整體,將「實質上使所有新模型部署停擺」。

採用的方法:縱深防禦策略

Fable 5 與 Mythos 5 上線前已部署多層安全措施,包含強化護欄、與政府及第三方合作進行數千小時的紅隊測試,以及完整的行為監控機制。Mythos 級模型另設有 30 天資料留存期,以支援事後稽核。Fable 5 具備三道主要安全分類器,分別針對網路安全、生物化學及模型蒸餾風險,違規時自動回退至 Opus 4.8

實際效果與後續立場

此次暫停對開發者與企業客戶的部署計畫造成直接衝擊,兩款模型定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,是 Anthropic 的旗艦收費方案。Anthropic 呼籲建立以技術事實為基礎、具法律效力的透明審查程序,反對以行政指令取代公開的安全評估機制,並強調現行程序缺乏法定依據與充分的技術論據。

原始來源:Anthropic News · Fable 5 / Mythos 5 發布公告


逆向工程 Apple M4 Max GPU:Metal 4.1 的 FP8 矩陣運算根本不走專用硬體

arXiv · 2026-06-11

研究者 Ramchand Kumaresan 於 arXiv:2606.12765(2026 年 6 月 11 日)發表論文,透過自建微基準測試框架 Rigel 對 Apple Metal 4.1 的張量運算路徑進行逆向工程,揭露 M4 Max GPU 上的 FP8 矩陣乘法(fp8 E4M3 matmul2d)並非走專用矩陣計算單元,而是完全在著色器核心(shader cores)上模擬執行。程式碼以 MIT 授權釋出,附帶可重現的 CSV 測試資料。

背景:Metal 4.1 的不透明張量設計

Apple 的 Metal 4.1 框架提供 matmul2d API,對外宣稱支援 FP8 張量運算,但內部執行路徑從未公開文件化。機器學習框架開發者與效能優化工程師長期缺乏足夠資訊,無法判斷此 API 是否真正利用了 M4 Max 的專屬矩陣硬體或 Neural Engine。Rigel 正是為填補這一資訊空白而設計的實驗性逆向工程框架,共回收了 11 項先前未記載的硬體行為。

核心發現:FP8 僅是記憶體優化,非算術加速

論文的核心結論是:fp8 matmul2d 的吞吐量僅為 FP16 的 0.94 倍,儘管 FP8 讀取的運算元位元組數只有 FP16 的一半。這意味著 FP8 在此路徑上的作用是減少記憶體帶寬佔用,而非提升算術吞吐,功能性質更接近一種記憶體壓縮格式。研究同時確認累加運算在 ≥FP32 精度下進行,並成功還原了不透明的 8×8 cooperative_tensor 片段(fragment)記憶體排列方式。

規格細節與實際優化效果

在實際應用層面,論文提出了手動融合的 GEMM + bias + GELU 核心,在快取駐留(cache-resident)場景下相較基線可獲得 +6.5–12.9% 的效能提升。這一結果說明,即便底層硬體路徑不如預期,透過充分了解實際執行特性仍可獲得有意義的優化空間,對以 Apple Silicon 為目標平台的推論框架開發者具有直接參考價值。

原始來源:arXiv:2606.12765


End of article
0
Would love your thoughts, please comment.x
()
x