資料與儲存 2026 年 6 月 9 日

2026-06-09 — Redis Data Integration GA:兩階段 CDC Pipeline、ClickHouse TPC-H 成本基準

primary=https://redis.io/blog/redis-data-integration-in-redis-cloud-is-now-ga-in-aws/ primary=https://clickhouse.com/blog/tpc-h-clickhouse-cloud-vs-snowflake-databricks-bigquery-redshift

Redis Data Integration 正式 GA:兩階段 CDC Pipeline 讓 Redis Cloud 成為即時資料服務層

Redis Blog · 2026-06-08

Redis 宣布 Redis Data Integration(RDI) 在 AWS 上正式 GA,提供從來源資料庫到 Redis Cloud 的近即時同步能力。RDI 採用兩階段 pipeline:先進行全量載入(Bulk Hydration),再切換至 CDC(Change Data Capture) 持續同步,將 Redis 定位為讀取流量的專用服務層,解耦對 OLTP 資料庫的壓力。

Pipeline 架構

第一階段 Bulk Hydration 支援 Snapshot SQL 語句,可選擇性載入部分資料集;第二階段 CDC Sync 透過資料庫的 binlog/WAL 機制監聽變更。GA 版本改善了 CDC 延遲與吞吐量,並以新的處理器加速全量載入速度。轉換層可將來源記錄映射為 Redis 原生資料結構(Hash、JSON、String 等),以便毫秒級存取。

支援的資料來源

  • 關聯式:MySQL、MariaDB、PostgreSQL、Oracle、SQL Server
  • MongoDB(生產就緒,GA 新增)
  • Snowflake(Preview,Reverse ETL 場景)

MongoDB 支援讓 JSON 文件可直接映射為 Redis JSON 結構,適合 Feature Store 情境;Snowflake 整合則支援 Reverse ETL,將分析倉儲的資料反向推入 Redis 作為 AI Agent 的即時上下文來源(Redis Iris 的底層機制)。

ClickHouse TPC-H 成本基準

ClickHouse 發布 TPC-H SF100 成本比較,在 ClickHouse Cloud 上執行全部 22 道查詢的費用低於 1 美分;相同工作負載在 Snowflake、Databricks、BigQuery、Redshift 上的成本顯著更高。

技術背景:ClickHouse 26.4 以前累積的最佳化包括並行雜湊 Join(24.12 版設為預設)、執行時過濾器(Bloom filter / min-max)、Lazy Column Replication,以及統計驅動的 Join 重排序,在 TPC-H SF100 上相較 22.4 版本整體提速 26 倍。六表 Join 查詢的特定案例從 3,903 秒縮短至 2.7 秒(約 1,450 倍)。

原始來源:Redis — RDI GA on AWSClickHouse — TPC-H benchmark


End of article
0
Would love your thoughts, please comment.x
()
x