Redis Data Integration 正式 GA:兩階段 CDC Pipeline 讓 Redis Cloud 成為即時資料服務層
Redis Blog · 2026-06-08
Redis 宣布 Redis Data Integration(RDI) 在 AWS 上正式 GA,提供從來源資料庫到 Redis Cloud 的近即時同步能力。RDI 採用兩階段 pipeline:先進行全量載入(Bulk Hydration),再切換至 CDC(Change Data Capture) 持續同步,將 Redis 定位為讀取流量的專用服務層,解耦對 OLTP 資料庫的壓力。
Pipeline 架構
第一階段 Bulk Hydration 支援 Snapshot SQL 語句,可選擇性載入部分資料集;第二階段 CDC Sync 透過資料庫的 binlog/WAL 機制監聽變更。GA 版本改善了 CDC 延遲與吞吐量,並以新的處理器加速全量載入速度。轉換層可將來源記錄映射為 Redis 原生資料結構(Hash、JSON、String 等),以便毫秒級存取。
支援的資料來源
- 關聯式:MySQL、MariaDB、PostgreSQL、Oracle、SQL Server
- MongoDB(生產就緒,GA 新增)
- Snowflake(Preview,Reverse ETL 場景)
MongoDB 支援讓 JSON 文件可直接映射為 Redis JSON 結構,適合 Feature Store 情境;Snowflake 整合則支援 Reverse ETL,將分析倉儲的資料反向推入 Redis 作為 AI Agent 的即時上下文來源(Redis Iris 的底層機制)。
ClickHouse TPC-H 成本基準
ClickHouse 發布 TPC-H SF100 成本比較,在 ClickHouse Cloud 上執行全部 22 道查詢的費用低於 1 美分;相同工作負載在 Snowflake、Databricks、BigQuery、Redshift 上的成本顯著更高。
技術背景:ClickHouse 26.4 以前累積的最佳化包括並行雜湊 Join(24.12 版設為預設)、執行時過濾器(Bloom filter / min-max)、Lazy Column Replication,以及統計驅動的 Join 重排序,在 TPC-H SF100 上相較 22.4 版本整體提速 26 倍。六表 Join 查詢的特定案例從 3,903 秒縮短至 2.7 秒(約 1,450 倍)。