Google DeepMind 聯手多機構設立千萬美元研究基金,聚焦多智能體 AI 安全
Google DeepMind · 2026-06-11
Google DeepMind、Schmidt Sciences、Cooperative AI Foundation、ARIA 及 Google.org 於 2026 年 6 月 11 日宣布,共同設立總額 1000 萬美元的研究資助計畫,目標是系統性解決多個 AI 代理相互交互時所產生的安全挑戰。申請截止日為 2026 年 8 月 8 日,獲獎結果預計於秋季公布,申請者須透過 Schmidt Sciences 的 smapply.io 平台提交。
背景:單一模型評估已不足夠
現有的 AI 安全評估框架主要針對單一模型在隔離環境中的表現,卻難以捕捉來自不同機構的多個代理相互溝通時所產生的「湧現行為」(emergent behaviors)。隨著數百萬個獨立代理開始在數位環境中交互,潛在的集體性風險已超越現有框架的應對能力。DeepMind 在公告中指出,「沒有任何單一實驗室能獨力解決多智能體安全問題」,呼籲全球學術界與獨立研究者積極參與。
四大優先研究領域
- 沙箱與測試平台:建立可重現的多智能體互動評估環境
- 代理網路特性分析:理解代理群體的集體能力與行為模式
- 安全基礎設施與協定:強化代理間通訊的安全性與可信度
- 監控與監督方法:為已部署的大規模代理族群建立有效的監督機制
本次資助計畫同時參考了近期探討「AI 代理陷阱」(AI Agent Traps)的研究,這類研究分析了對抗性環境中代理系統的潛在漏洞。多機構聯合出資的結構設計,也呼應了跨組織合作才能覆蓋多元代理生態的核心主張。
原始來源:Google DeepMind Blog
美國政府以國家安全為由強制暫停 Fable 5 與 Mythos 5,Anthropic 依令執行但公開表達異議
Anthropic · 2026-06-12
美國政府發布出口管制指令,要求 Anthropic 暫停 Fable 5 與 Mythos 5 對所有使用者(包含外國公民)的存取權限。Anthropic 於 2026 年 6 月 12 日發表聲明,表示遵從法律指令,但同時對此決定提出反駁。Anthropic 其餘所有模型不受本次指令影響。
原本的問題:越獄技術引發管制
政府指令中提及當局掌握「一種繞過 Fable 5 安全機制的越獄方法」,但未披露技術細節。Anthropic 自行檢視後認定,該技術利用的是「少數已知的輕微漏洞」,且類似能力同樣存在於其他公開可用的模型中。公司警告,若以此為標準套用於業界整體,將「實質上使所有新模型部署停擺」。
採用的方法:縱深防禦策略
Fable 5 與 Mythos 5 上線前已部署多層安全措施,包含強化護欄、與政府及第三方合作進行數千小時的紅隊測試,以及完整的行為監控機制。Mythos 級模型另設有 30 天資料留存期,以支援事後稽核。Fable 5 具備三道主要安全分類器,分別針對網路安全、生物化學及模型蒸餾風險,違規時自動回退至 Opus 4.8。
實際效果與後續立場
此次暫停對開發者與企業客戶的部署計畫造成直接衝擊,兩款模型定價為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元,是 Anthropic 的旗艦收費方案。Anthropic 呼籲建立以技術事實為基礎、具法律效力的透明審查程序,反對以行政指令取代公開的安全評估機制,並強調現行程序缺乏法定依據與充分的技術論據。
逆向工程 Apple M4 Max GPU:Metal 4.1 的 FP8 矩陣運算根本不走專用硬體
arXiv · 2026-06-11
研究者 Ramchand Kumaresan 於 arXiv:2606.12765(2026 年 6 月 11 日)發表論文,透過自建微基準測試框架 Rigel 對 Apple Metal 4.1 的張量運算路徑進行逆向工程,揭露 M4 Max GPU 上的 FP8 矩陣乘法(fp8 E4M3 matmul2d)並非走專用矩陣計算單元,而是完全在著色器核心(shader cores)上模擬執行。程式碼以 MIT 授權釋出,附帶可重現的 CSV 測試資料。
背景:Metal 4.1 的不透明張量設計
Apple 的 Metal 4.1 框架提供 matmul2d API,對外宣稱支援 FP8 張量運算,但內部執行路徑從未公開文件化。機器學習框架開發者與效能優化工程師長期缺乏足夠資訊,無法判斷此 API 是否真正利用了 M4 Max 的專屬矩陣硬體或 Neural Engine。Rigel 正是為填補這一資訊空白而設計的實驗性逆向工程框架,共回收了 11 項先前未記載的硬體行為。
核心發現:FP8 僅是記憶體優化,非算術加速
論文的核心結論是:fp8 matmul2d 的吞吐量僅為 FP16 的 0.94 倍,儘管 FP8 讀取的運算元位元組數只有 FP16 的一半。這意味著 FP8 在此路徑上的作用是減少記憶體帶寬佔用,而非提升算術吞吐,功能性質更接近一種記憶體壓縮格式。研究同時確認累加運算在 ≥FP32 精度下進行,並成功還原了不透明的 8×8 cooperative_tensor 片段(fragment)記憶體排列方式。
規格細節與實際優化效果
在實際應用層面,論文提出了手動融合的 GEMM + bias + GELU 核心,在快取駐留(cache-resident)場景下相較基線可獲得 +6.5–12.9% 的效能提升。這一結果說明,即便底層硬體路徑不如預期,透過充分了解實際執行特性仍可獲得有意義的優化空間,對以 Apple Silicon 為目標平台的推論框架開發者具有直接參考價值。
原始來源:arXiv:2606.12765