CVE-2026-31431「Copy Fail」:AF_ALG 頁面快取污染從容器提權至宿主,Docker 29.4.3 的三層緩解策略
Docker Blog · 2026-05-27
CVE-2026-31431(別名「Copy Fail」)是 Linux 核心 algif_aead(AF_ALG)子系統的 privilege escalation 漏洞,影響 2017 年後的核心版本。容器內的無特權使用者只需能建立 AF_ALG socket,即可對宿主的頁面快取執行受控寫入,進而透過污染 setuid 執行檔取得 host root。
漏洞機制
攻擊路徑:攻擊者在容器內建立 AF_ALG socket → 利用 algif_aead 的缺陷向頁面快取寫入任意內容 → 污染宿主與所有容器共用的映像層中的 setuid 執行檔 → 在宿主上執行後取得 root。因容器共享宿主核心,污染不僅限於攻擊者的容器,影響同一宿主上的所有容器與宿主本身。CVE 公開時間:2026 年 4 月 29 日;Ubuntu 核心補丁尚未發布,Debian 與 RHEL 已有核心補丁。
Docker 29.4.2 的失敗嘗試
Docker 29.4.2 嘗試以 seccomp 封鎖 socket(AF_ALG) 與 socketcall(2),但引發 regression:socketcall(2) 是多工 syscall,BPF filter 無法解引用指標檢查實際的 address family;完全封鎖 socketcall 破壞了 i386 legacy glibc、Go 的 GOARCH=386 runtime,以及 SteamCMD、Wine 等 32-bit 應用。amd64 程序也可透過 int $0x80 切換至 ia32 相容模式繞過限制。
Docker 29.4.3 的三層解決方案
- AppArmor(Ubuntu/Debian):在預設 AppArmor profile 中加入
deny network alg,,於security_socket_create()核心 hook 層封鎖 AF_ALG,覆蓋socket(2)與socketcall(2)兩個入口點 - SELinux CIL 策略模組(Fedora/RHEL):拒絕所有
container_domain型別建立alg_socket,需--selinux-enableddaemon 旗標啟用 - Seccomp 縱深防禦:僅封鎖直接
socket(AF_ALG)syscall,作為無 LSM 系統的補充
LSM(AppArmor/SELinux)優於 seccomp 的原因:LSM hook 在物件建立層操作,不依賴 syscall 入口點,可選擇性封鎖特定 address family 而不影響 32-bit 相容性。
受影響版本與緩解措施
Docker Engine < v29.4.3 受影響;v29.4.3 及以上版本已包含緩解措施,無需重新啟動。若暫時無法升級,可將 af_alg 與 algif_aead 核心模組加入 blacklist(僅在模組非 built-in 時有效),或使用自訂 seccomp profile。
原始來源:Docker Blog — Mitigating CVE-2026-31431 in Docker Engine
Google Research:零信任聚合私人分析——TEE + 格密碼 + 差分隱私的三層架構
Google Research Blog · 2026-05-27
Google Research 發布零信任聚合(zero-trust aggregation)私人分析系統的技術細節,結合格密碼協議(lattice-based protocol)、可信執行環境(TEE)與差分隱私(DP)三層防護,讓分析人員在不存取原始個人資料的情況下取得統計洞察,並部署於 Android SafetyCore 服務。
架構設計
格密碼層是本系統的核心創新:設計了一個「一次性訊息提交(one-shot)」的格密碼協議,使裝置只需傳送一次加密訊息,消除傳統安全聚合方案需要多輪互動的要求(過去要求裝置在多輪通訊中保持在線)。同態特性允許在密文狀態下直接聚合,包含底層明文值與加密金鑰的同步聚合。
委員會解密與 TEE
解密採用分散式委員會設計:小型客戶端委員會持有「hints」,協助解鎖聚合後的值——任何單一實體都無法獨立解密。TEE(Intel TDX / AMD SEV-SNP)提供硬體層保證:個人原始資料從不在任何伺服器記憶體中以明文重建,即便在硬體保護邊界內。可驗證的 TEE attestation 讓各方可確認協議確實按設計執行。差分隱私在聚合後的輸出階段注入噪音,提供數學可證明的個人隱私保護。
實際部署
系統部署於 Google SafetyCore,用於評估安全分類器在全球裝置群上的準確率(true positive rate)。分析人員能觀察分類器的整體效能趨勢,卻無法存取觸發分類的敏感個人內容,實現了模型改進與使用者隱私的共存。這是 Google 在 Pixel Recorder、Gboard 之後的第三代聯邦分析部署。
原始來源:Google Research — Private analytics via zero-trust aggregation