Cloudflare AI Gateway 推出實時消費上限:防止 AI token 費用失控
Cloudflare Blog · 2026-06-05
Cloudflare AI Gateway 推出即時消費上限(spend limits)功能,以美元預算追蹤跨多個 AI 提供商的累計花費,並在預算達到時攔截或改轉請求。功能以開放 Beta 向所有 AI Gateway 用戶免費開放,包含所有付費層級,並可透過 Dashboard 或 API 設定。
工作原理
Spend limits 根據各模型定價即時計算每個請求的 token 成本,將累計花費與設定的預算閾值比較。這與傳統的速率限制(rate limiting)不同:速率限制以請求數或 token 數計算,消費上限以實際貨幣金額計算,直接對應帳單而非流量指標。
設定維度支援三個層級:
- 模型層級:限制特定模型(如 GPT-5 或 Claude Opus)的總花費
- 提供商層級:限制對 OpenAI、Anthropic、Google 等特定提供商的總花費
- 自訂屬性層級:依 user ID、team ID、application ID 等自訂標籤設定預算
時間視窗支援固定週期(月、週、日重置)和滾動週期。當預算達到時,預設行為是直接攔截請求並返回錯誤;替代方案是配置 Dynamic Routes,將超出預算的請求自動改轉到更便宜的模型,而非中斷服務。
身份識別預算(Identity Budgets)
閉測中的身份識別預算功能讓組織可以與現有 IdP(身份提供商)整合,對個別用戶設定月度預算(例如:每位工程師 $500/月)或對特定用戶組設定模型存取政策。這個功能針對的是組織內部 AI 工具使用管理,而非對外服務的速率保護。
影響範圍
Cloudflare AI Gateway 定位為 AI 流量的統一代理層,坐落在應用程式與多個 AI 提供商 API 之間。消費上限功能解決的是一個已造成實際損失的問題:AI API 費用的非線性增長特性(一個惡意或失控的請求迴圈可以在幾分鐘內產生數千美元費用)讓傳統的請求量速率限制不足以防護。以金額而非請求量作為控制變數,更直接地對應財務風險。
原始來源:Cloudflare Blog
英國政府 GOV.UK 拋棄 Stripe 轉投荷蘭支付商 Adyen
The Register · 2026-06-04
英國政府數位服務(Government Digital Service,GDS)宣佈將 GOV.UK Pay 的支付處理商從 Stripe 更換為荷蘭公司 Adyen。GOV.UK Pay 是英國中央政府統一的線上收費平台,處理跨數十個政府部門的繳費(簽證費、罰款、許可證等),此次遷移影響全英國公民面向政府的支付體驗。
遷移背景
The Register 報導此次合約更換的核心原因是政府採購合規要求:英國公部門合約需定期公開招標,GDS 的 Stripe 合約到期後重新招標,Adyen 以更具競爭力的條件中標。Adyen 是阿姆斯特丹上市公司,在歐洲公部門支付市場有成熟的合規記錄,持有歐洲央行核發的電子貨幣機構牌照,在 PCI-DSS 合規方面已深度整合政府級需求。
技術影響
GOV.UK Pay 是一個抽象層——政府服務接入 GOV.UK Pay API,Pay 再與底層支付處理商對接。對最終使用者(公民)而言,遷移在理論上是透明的;對接入 GOV.UK Pay 的政府部門而言,其代碼不需要更改,因為介面層保持不變。真正的技術工作集中在 GDS 與 Adyen 的整合層:支付流程、退款機制、settlement 報表、3DS2 強認證流程的重新映射,以及既有交易資料的處理。
Adyen 以「直接連結」模型區別於 Stripe 的水平平台策略——Adyen 直接接入各地卡組織網路(Visa、Mastercard、American Express 等),而非透過中間商,這在費率結構和結算時效上有不同的特性,適合高交易量的政府場景。
影響範圍
這次採購決策的工程意義在於:當一個大型平台更換底層支付提供商時,支付抽象層(Payment Abstraction Layer)的設計品質直接決定遷移難度。GOV.UK Pay 在設計初期就選擇了抽象化的原因之一正是為了保留替換底層處理商的靈活性,這次遷移是該設計決策在多年後實際發揮效用的案例。
原始來源:The Register