企業資料平台 / 湖倉 / 串流 (Data Platform & Lakehouse)
AI 真正的瓶頸不是模型而是「資料底座」——湖倉/串流/轉換是每個 AI agent 的燃料管線,2026 成兵家必爭:Databricks 傳 $165-175B 新輪(ARR $5.4B→$6.9B、AI 產品 ARR $1.4B);Snowflake(SNOW)產品營收 $1.33B/季 +34%、與 AWS 簽 $6B 五年約後單日飆 36%、創 2026 新高;IBM 以 $11B 吞下 Confluent(2026-03 完成);SAP 收 Dremio、Fivetran×dbt 合併(2026-06)。價值鏈:物件儲存+開放表格式(Iceberg/Delta)→ 攝取轉換(Fivetran/dbt)→ 湖倉/雲倉(Databricks/Snowflake/BigQuery/Fabric/ClickHouse)→ 即時串流(Confluent/Flink/Redpanda)→ 營運/向量庫(MongoDB/Postgres)。⚠ 有別於 rag_kb(企業搜尋/檢索層),本主題是其下方的底層資料平台。
← 回 企業軟體 AI / 自動化 / 數位勞工 主題列表 · 回首頁
物件儲存 + 開放表格式 (Iceberg / Delta) Object Storage & Open Table Formats
湖倉的物理底座是雲端物件儲存(S3/ADLS/GCS),其上加一層『開放表格式』提供 ACID/時間旅行/schema 演進。2026 表格式之爭收斂為『共存』:Iceberg 引擎中立勝出、Delta 靠 UniForm 互通。
Apache Iceberg 成事實標準:Snowflake 原生支援、AWS Athena/Glue 一級公民、Google BigQuery『Lakehouse for Apache Iceberg』(原 BigLake,2026-04 改名)、Salesforce Data Cloud 用 Iceberg 撐 4M 表 50PB。Snowflake 開源的 Iceberg REST 目錄 Apache Polaris 於 2026-02 升 Apache 頂級專案。Delta Lake 4.1.0(2026-03)強化 Kernel/Spark;UniForm 讓 Delta 一次寫、可當 Iceberg 被 Snowflake/BigQuery/Redshift 讀。Databricks 收 Tabular(Iceberg 原創者)並推 Iceberg v3——Snowflake 已於 2026-05-07 將 Iceberg v3 全部 7 項功能(deletion vectors 提速 DML 達 10x、row lineage 原生 CDC、VARIANT 半結構化型別等)升為 GA、Databricks 於 6/15-18 Data+AI Summit 同步宣布 v3 GA,Iceberg 正式從『公開預覽』變成兩強共同背書的『生產級跨平台事實標準』;Unity Catalog 可聯邦至 Polaris/Glue/Salesforce 等外部目錄(雙向讀寫),主導兩陣營合流。底層物件儲存由 AWS S3 / Azure ADLS / Google GCS 三雲壟斷。絃外之音:Iceberg v3 GA 後,鎖喉點由表格式本身轉移到『目錄/治理層』(Unity Catalog vs Polaris/Horizon Catalog);資料『可攜』、客戶議價力上升,長期壓縮單一廠商儲存/格式鎖定暴利,價值往目錄/治理層集中。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] Amazon S3 / AWS (AMZN) | 雲端物件儲存龍頭 | Iceberg 一級公民;與 Snowflake 簽 $6B 五年約 |
| [US] Microsoft Azure (MSFT) | ADLS + OneLake 底座 | Fabric OneLake 28,000+ 客戶 |
| [US] Google Cloud Storage (GOOGL) | GCS + Iceberg 互通 | 2026-04 BigLake 改名;與 Trino/Spark 讀寫互通 |
| [US] Databricks (Delta / Tabular) (—) | Delta Lake 始祖 + 收 Iceberg 原創者 | 未上市;收 Tabular 主導 Iceberg×Delta 合流 |
| [US] Snowflake (Polaris / Iceberg) (SNOW) | Iceberg 原生 + 開源目錄 | Polaris 2026-02 升 Apache 頂級專案;2026-05-07 將 Iceberg v3 全 7 項功能升 GA;Horizon Catalog 跑在 Polaris 上撐雙向讀寫 |
資料來源
資料攝取 / 整合 / 轉換 (ETL/ELT, CDC, dbt) Ingestion, Integration & Transformation
把分散資料搬進湖倉並建模的『水管工』層:批次/即時攝取(ETL/ELT)、變更資料擷取(CDC)、與資料轉換建模(dbt)。是 AI 資料品質與治理的第一道關卡。
2026 最大事件為 Fivetran × dbt Labs 合併(2025-10 宣布、2026-06-01 完成),合併後 ARR 近 $600M、估值傳 >$10B;80-90% Fivetran 客戶已用 dbt,整合 ELT 攝取與資料建模/轉換為一體,旨在打造『值得信賴的 AI agent 資料基礎設施』。其他玩家:Airbyte(開源 ELT,350+ 連接器)、Microsoft Fabric Data Factory(原生 OneLake、低代碼+AI)、Snowflake Datavolo(攝取)、Informatica(Salesforce 已完成 $8B 收購、併入 Agentforce 360)、Talend/Qlik。絃外之音:M&A 把『攝取+轉換』收編進更大平台——Fivetran×dbt 對等合併、Salesforce 吃下 Informatica,獨立 ETL/治理中型標的被快速吞噬;dbt 的『語意層/資料合約』與 Informatica 的『可信資料治理』成 agentic AI 取用可信資料的關鍵卡位。
資料來源
湖倉 / 雲端資料倉儲(核心戰場) Lakehouse & Cloud Data Warehouse
AI 資料底座的『主機板』,三強(Databricks/Snowflake/雲端原生)+ 挑戰者(ClickHouse/Starburst)混戰。消費型計費、黏性強、NRR 高(Snowflake 126%),是『賣鏟給 AI』最確定性的一鏟。
Databricks(未上市,Lakehouse 始祖):ARR $5.4B→$6.9B(2026-06)、估值傳 $165-175B(vs 上輪 $134B);AI 產品 ARR $1.4B(約占 26%);Unity Catalog 治理、Mosaic ML($1.3B 收購)訓練、Genie 對話查詢、Lakebase(serverless Postgres for AI agent,源自 $1B 收 Neon)。Snowflake(SNOW):產品營收 $1.33B/季 +34%、上修全年 guidance $5.84B、NRR 126%、$1M+ 客戶 779 家;與 AWS 簽 $6B 五年約後股價單日 +36% 觸 52 週高 $282(仍低於 2021 ATH $401.89);Cortex AI、Polaris/Iceberg、收 Crunchy Data($250M)補 Postgres。雲端原生:Google BigQuery(serverless+Iceberg 互通)、AWS Redshift(Zero-ETL)、Microsoft Fabric(SaaS-first,FY26 Q2 ARR 突破 $2B、客戶 >31,000 家、+60% YoY,Delta+Iceberg 雙原生;FabCon 2026 與 Azure Databricks 經 Unity Catalog 互讀 OneLake 轉『互補』)。挑戰者:ClickHouse(未上市,開源列式即時分析,年化營收 $250M 3 倍增,2026-01 完成 $400M Series D 估值升 $15B 朝 IPO;同輪收購 LLMOps 龍頭 Langfuse 切入 AI 回饋迴路、並推 Postgres 託管)、Starburst($3.35B,Trino 引擎)、Dremio(Iceberg 湖倉,2026-05 被 SAP 簽收、預計 2026Q3 結案,Business Data Cloud 將成『Iceberg 原生企業湖倉』,傳統 ERP 巨頭成湖倉新進入者)。⚠ 風險:consumption 計費景氣敏感;超大規模雲廠 bundling 擠壓;私有龍頭估值 >60x 年化營收過熱。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] Databricks (—) | Lakehouse 始祖 / AI 資料底座 | 未上市;ARR $5.4B(+65% YoY);The Information(2026-06-09)報導 $165-175B 新輪『商談中』(vs 2026-02 完成的 $134B Series L)、截至 6 月中尚未完成;AI 產品 ARR >$1.4B(約占 26%);稱進『IPO 準備模式』最快 2026 年底掛牌,但 CEO Ghodsi 稱今年是『糟糕的上市年』;Lakebase 升 GA、Agent Bricks 已建逾 100k agents |
| [US] Snowflake (SNOW) | 雲端資料雲龍頭 | 產品營收 $1.33B/季 +34%、guidance $5.84B、NRR 126%;AWS $6B 約、單日 +36%;Summit 2026 併購 Natoma(agent 治理/企業 MCP)、推 Cortex Sense/CoWork |
| [US] Microsoft Fabric (MSFT) | SaaS-first 一站式湖倉 | FY26 Q2 揭露 Fabric ARR 突破 $2B、客戶 >31,000 家、+60% YoY;Delta+Iceberg 雙原生;FabCon 2026 推 OneLake 雙向讀、Azure Databricks 經 Unity Catalog 原生讀 OneLake(轉互補) |
| [US] Google BigQuery (GOOGL) | serverless 雲倉 | serverless;與 Trino/Spark Iceberg 讀寫互通 |
| [US] AWS Redshift (AMZN) | AWS 生態雲倉 | AWS 生態整合;Zero-ETL |
| [US] ClickHouse (—) | 開源即時分析挑戰者 | 未上市;年化 $250M(3 倍增);2026-01 完成 $400M Series D 估值升 $15B(Dragoneer 領投,>60x 年化營收),前 Snowflake IR 主管任 CFO 備 IPO;同輪收購開源 LLM 可觀測性龍頭 Langfuse(Fortune 50 中 19 家採用)切入『AI 回饋迴路/LLMOps』、並推 Postgres 託管服務 |
| [US] Starburst / Dremio (—) | Trino/Iceberg 查詢引擎 | Starburst $3.35B;Dremio 2026-05 被 SAP 收(預計 2026Q3 close) |
| [CN] 阿里雲 MaxCompute (9988.HK) | 中國 serverless 雲倉 | 中國最大 serverless 資料倉儲 |
資料來源
即時串流 (Kafka / Flink / Streaming) Real-time Streaming
AI agent 即時決策的『神經』:以 Apache Kafka/Flink 處理『資料在動中』(data in motion),供應即時特徵與事件流。是 agentic AI 從批次走向即時的關鍵基礎設施。
2026 結構性事件:IBM 以 $31.00/股、企業價值 $11B 收購 Confluent(2025-12 宣布、2026-03-17 完成全現金交易),整合 watsonx+混合雲建『即時 AI 資料 fabric』;Forrester 直言『IBM 買的不是 Kafka,是即時 AI』。Think 2026(5 月)推 Confluent『Real-Time Context Engine』把即時事件直灌 watsonx.data(附帶 lineage/policy/品質控管),串流正式從『日誌管線』升級為『agent 的即時資料平面』。Confluent FY2025 訂閱營收 $1.12B(+21%)、Cloud $624M(+27%)、6,500+ 企業/40% Fortune 500、$100K+ ARR 客戶 1,521 家。其他玩家:Apache Flink(Confluent 與阿里 Ververica 主導)、AWS Kinesis/MSK(AMZN)、Redpanda(Kafka 相容 C++,估值 $1B)、Google Pub/Sub、Azure Event Hubs、阿里 DataHub。絃外之音:純獨立串流公開標的(Confluent)被吞噬後,剩下的純標的越來越稀缺;串流正從『日誌管線』升級為『AI agent 的即時資料平面』。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] Confluent (IBM 旗下) (IBM) | Kafka 商業化龍頭 | 2026-03 被 IBM $11B($31/股)收購完成;FY2025 訂閱 $1.12B +21%、Cloud $624M +27%;6,500+ 企業;Think 2026(5 月)推 Real-Time Context Engine 把即時事件直灌 watsonx.data(含 lineage/policy/品質控管),升級為 agent 即時資料平面 |
| [US] AWS Kinesis / MSK (AMZN) | 雲廠原生串流 | AWS 生態原生串流 |
| [US] Redpanda (—) | Kafka 相容高效挑戰者 | 未上市;Series D $100M、估值 $1B;累計募資 $266M |
| [US] Google Pub/Sub (GOOGL) | GCP 原生訊息 | GCP 原生串流與 ETL |
| [US] Microsoft Azure Event Hubs (MSFT) | Azure 原生串流 | Fabric Real-Time Intelligence 整合 |
| [CN] 阿里 Ververica / DataHub (9988.HK) | Flink 商業化(中國) | Apache Flink 創始團隊商業化 |
資料來源
營運 / 向量資料庫 (Operational & Vector DB) Operational & Vector Databases
AI agent 運轉需要『會寫、低延遲、帶向量』的營運交易庫;2025-26 出現『Postgres 文藝復興』與 HTAP(交易+分析+向量一體)的平台邊界融合。
MongoDB(MDB):文件資料庫龍頭,Q1 FY2027 總營收 $687.6M(+25%)、Atlas +29.4% 達 $2B run-rate(占 75%)、上修全年至 $2.92-2.96B;收 Voyage AI(嵌入/重排)補向量,向量搜尋自動嵌入(public preview)、Voyage 客戶季增逾倍;2026-06-12 收 $342.80。Postgres 軍備競賽:Databricks Lakebase(源自 $1B 收 Neon serverless Postgres,定位『the database for the AI era』) vs Snowflake(收 Crunchy Data $250M 補企業級 Postgres)——分析湖倉反向吃進營運交易庫。HTAP/向量原生:PingCAP TiDB(CN/US,HTAP+原生向量,主打 agentic workload)、阿里 PolarDB。絃外之音:Neon/Crunchy/Lakebase 收購潮顯示平台正融合『分析+交易+向量』為一體,AI agent 要的是 HTAP;對只能買公開股的投資人,MDB 與 SNOW/MSFT/GOOGL/AMZN 雲部門是有限的『替身』標的(Databricks 拒絕 IPO)。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] MongoDB (MDB) | 文件資料庫 / 向量龍頭 | 總營收 $687.6M/季 +25%、Atlas $2B run-rate +29%;收 Voyage AI;guidance $2.92-2.96B |
| [US] Databricks Lakebase (Neon) (—) | serverless Postgres for AI | 未上市;$1B 收 Neon;『database for the AI era』 |
| [US] Snowflake (Crunchy Data) (SNOW) | 企業級 Postgres | $250M 收 Crunchy 補企業級 Postgres |
| [CN] PingCAP TiDB (—) | HTAP + 原生向量 | 未上市;主打 agentic workload、交易+分析+向量一體 |
| [CN] 阿里雲 PolarDB (9988.HK) | 中國雲原生資料庫 | 中國雲原生 HTAP |
資料來源
💬 留言討論 (0)
歡迎分享你對此供應鏈/個股的看法。需以 Google 帳號登入後留言;內容僅供研究討論,非投資建議。