DuckDB 雙版本同步發布:1.5.4 穩定版與 1.4.5 LTS 修正安全漏洞、提升效能
DuckDB News · 2026-06-17
DuckDB 開發團隊於 2026 年 6 月 17 日同步釋出兩個版本:主線第五個修補版本 1.5.4(代號 Variegata)以及長期支援分支的第六個修補版本 1.4.5(代號 Andium)。兩個版本均包含錯誤修正、效能改善與安全性強化,面向不同需求的使用者提供持續維護支援。DuckDB 是廣泛應用於嵌入式分析場景的開源 OLAP 資料庫引擎,此次雙版本同步釋出是其長期維護策略的一部分。
1.5.4 Variegata:正確性與穩定性修正
正確性問題是本次 1.5.4 版本最受關注的修正項目。其中一個典型案例是 VARIANT 類型在過濾條件下錯誤讀取資料列的問題,該錯誤可能導致查詢結果不正確,在依賴 VARIANT 欄位做條件篩選的工作流程中影響尤為明顯。此外,MERGE INTO 語句的繫結邏輯也獲得修正,以及 INSERT 操作中不區分大小寫欄位匹配的問題。
穩定性方面,本版本解決了多個會導致程式崩潰的情境。Arrow GeoArrow 序列化中的記憶體洩漏、在管道(pipe)輸出時進度列的顯示失敗,以及列群組重新排序統計中的空指標解參考,均已逐一修復。JSON 相關的錯誤也獲得全面整理,包含萬用字元路徑處理、參數順序,以及錯誤驗證邏輯的修正。
效能方面,1.5.4 針對使用 jemalloc 建置環境導入了系統堆積(heap)回收最佳化,並改善了原生幾何類型的 Parquet 統計修剪能力。功能面的新增項目包含:CLI 支援明確指定深色與淺色模式,並改善終端機自動偵測邏輯;以及一個實驗性的 vacuum_rebuild_indexes ATTACH 選項,用於索引重建場景。Parquet 解壓縮與反序列化的安全強化同樣列入此次發布範圍。
1.4.5 Andium LTS:向後移植修正與競態條件修復
1.4.5 是 DuckDB 長期支援分支的第六個修補版本,主要目的是將上游修正向後移植至對穩定性要求更高的生產環境。正確性修正包含儲存解碼階段的整數溢位偵測,以及 * NOT SIMILAR TO 'pattern' 模式比對語法的支援,此語法原本在 1.4 分支中尚未實作。
穩定性層面,1.4.5 整合了多個競態條件(race condition)修正,防止並發操作中出現崩潰與內部錯誤。CSV 讀取器的緩衝區邊界讀取問題也一併修復,Secret Manager 被調整為保證單次建立實例,避免重複初始化導致的不確定行為。此外,越界(out-of-bounds)存取安全漏洞也透過向後移植方式修補。
效能改善部分,AsOf Simple Joins 最佳化被移植至 LTS 分支,Zstd 壓縮效率同樣得到提升。AddEscapes 函式中的跳脫序列處理錯誤已修正,對索引表進行重複載入與插入操作時的列群組過度增長問題也受到控制。檔案系統 API 實作亦已更新至較新的介面標準。
版本選擇與未來展望
對於需要持續跟進新功能的使用者,建議升級至 1.5.4;對於企業生產環境或對 API 相容性有嚴格要求的部署,1.4.5 LTS 提供更保守的升級路徑。兩個版本均可透過 DuckDB 官方安裝頁面依作業系統與目標版本分別下載。
開發團隊同時預告,DuckDB v2.0.0 預計於 2026 年秋季釋出,並將舉辦第七屆社群聚會 DuckCon #7,地點定於荷蘭阿姆斯特丹。對於目前使用 1.x 系列的團隊,在 2.0.0 發布前持續關注其遷移指引將有助於提前規劃升級策略。
原始來源:DuckDB 1.5.4 (Variegata) 發布公告、DuckDB 1.4.5 LTS (Andium) 發布公告
ClickHouse ClickPipes 新增 GCP Pub/Sub 連接器,進入私人預覽階段
ClickHouse Blog · 2026-06-17
ClickHouse 於 2026 年 6 月 17 日宣布,ClickPipes 資料攝取服務新增 GCP Pub/Sub 連接器,目前進入私人預覽(Private Preview)階段。此連接器讓使用者可以直接將 Google Cloud Pub/Sub 的訊息串流引入 ClickHouse Cloud,無需額外的中介基礎設施,適用於 GCP 上的基礎設施日誌、應用事件與運營訊號等分析場景。
格式支援與 Schema 自動推斷
此連接器支援 JSON、Avro 與 Protobuf 三種主流資料格式,並與 Pub/Sub Schema Registry 原生整合。Schema 推斷可自動進行,將 Pub/Sub 訊息中的欄位類型映射至 ClickHouse 原生資料類型,減少手動設定的負擔。壓縮格式的酬載(payload)可被自動偵測並解壓縮,不需要額外的設定步驟。
資料攝取的起始偏移量(offset)支援三種模式:最新訊息(latest)、最早訊息(earliest),以及指定時間戳,這些模式均利用 Pub/Sub 的原生 seek 功能實現。訊息過濾功能允許依據 Pub/Sub 訂閱過濾條件(subscription filter)篩選訊息,可在攝取前降低資料量與成本。每個 key 的有序投遞(per-key ordered delivery)也在支援範圍內。
無需額外基礎設施的架構設計
相較於傳統方案需透過 GCS 或 Dataflow 進行中轉,此連接器採用直連設計,不需要額外部署任何路由元件。內建的指標與監控介面提供管道運行的可見性,且支援就地編輯(edit in place)管道設定,無需重新建立整個管道即可調整配置。
在基礎設施即程式碼(Infrastructure as Code)的使用場景上,連接器支援透過 Terraform 與 OpenAPI 進行設定部署。設定參數包含資料格式、GCP 專案資訊、Pub/Sub 主題選擇、認證方式,以及 seek 類型設定。目的地資料表的欄位映射與資料表定義均可在連接器設定中一併完成。
私人預覽資格與後續計劃
目前此連接器處於私人預覽階段,預覽期間免費提供使用。有興趣的使用者可透過 ClickHouse 官網加入等待名單,或直接聯絡其客戶帳號管理人員申請存取權限。ClickPipes 作為 ClickHouse Cloud 的受管理資料攝取服務,此前已支援 Amazon Kinesis、Apache Kafka 等串流來源,此次新增 GCP Pub/Sub 進一步擴展了對多雲環境的覆蓋範圍。
原始來源:ClickHouse Blog — ClickPipes GCP Pub/Sub Connector Private Preview