AI 晶片新創供應鏈 (AI Chip Startups: Inference Silicon)
AI Chip Startups — AI 算力重心由「訓練」轉向「推論」,給專用推論晶片新創一道挑戰 NVIDIA 約 74% 推論市佔的縫隙。2026 熱度爆量:Cerebras(CBRS) 5/14 上市、募 $5.55B(年度最大科技 IPO)、開盤近 $350 翻倍、在手合約 $24.6B;Groq 被 NVIDIA 以約 $20B 非獨家授權「軟收編」LPU;Qualcomm 傳 $8–10B 洽購 Tenstorrent;韓國「K-Nvidia」國家隊 Rebellions $2.34B 估值、FuriosaAI 拒 Meta $800M 改靠 LG。AI 推論市場 2026 約 $76–118B。價值鏈:RISC-V/EDA/IP → TSMC 先進製程+CoWoS+HBM(共同瓶頸,已售罄)→ 推論晶片新創 → CUDA 軟體護城河 → 推論雲/主權 AI 部署。有別於 asic(超大規模自研)與 china_semi(國產算力)。⚠ 贏家極少、被收編是常見退出,估值高度分化。
← 回 半導體硬體供應鏈 主題列表 · 回首頁
IP / EDA / RISC-V 核心 IP, EDA & RISC-V Cores
推論晶片新創的設計起點:RISC-V 或 Arm CPU 核心、EDA 工具、SerDes/die-to-die 互連 IP。多數新創採 RISC-V 以避開 Arm 授權上限並掌握架構自主。
EDA 由 Synopsys(SNPS)、Cadence(CDNS)雙寡頭壟斷設計流程,是任何 AI 晶片繞不開的入口。RISC-V 陣營快速崛起:SiFive(商用先驅、未上市)、晶心 Andes(6533.TWO,台廠 RISC-V IP 龍頭)、Tenstorrent(自有 Ascalon 核心 + 2025 併 Blue Cheetah die-to-die IP,兼具 IP 供應與整機新創雙重身分)。Arm(ARM)Neoverse 仍為部分新創 CPU 選項(如 Rebellions 與 Arm/Samsung Ventures 合作)。SerDes/UCIe chiplet 互連由 Alphawave、Synopsys、Cadence 提供(連結 chiplet_ucie 主題)。絃外之音:RISC-V 從下端、hyperscaler 自研微架構從上端,雙面夾擊 Arm 的 royalty 模式——這也是 Qualcomm 看上 Tenstorrent RISC-V IP 的核心。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] Synopsys (SNPS) | EDA 雙雄之一 | AI 晶片設計繞不開的入口;新創 IP 供應 |
| [US] Cadence (CDNS) | EDA 雙雄之一 | AI 晶片設計與驗證 |
| [UK] Arm Holdings (ARM) | CPU IP 龍頭 | Rebellions 與 Arm/Samsung Ventures 合作;新創 CPU 選項之一 |
| [US] SiFive (—) | RISC-V 商用先驅 | 未上市;RISC-V 商用化先行者 |
| [TW] 晶心科技 Andes (6533.TWO) | 台廠 RISC-V IP 龍頭 | 累計授權 >200 億顆;高階 CAGR ~30% |
| [US] Tenstorrent (IP) (—) | RISC-V AI IP + 整機 | 未上市;2025 併 Blue Cheetah;Qualcomm 傳 $8–10B 洽購其 RISC-V/CPU IP |
資料來源
代工 / CoWoS / HBM(共同瓶頸) Foundry, CoWoS & HBM Bottleneck
推論晶片新創幾乎全下單 TSMC 先進製程,並排隊搶 CoWoS 先進封裝與 HBM3E。這條供應鏈 2026 已售罄,是新創最大交期風險,也是 NVIDIA 的盾。
代工:TSMC(2330.TW / TSM)N5/N4/N3/N2 為新創共同選擇——Cerebras WSE 用 TSMC 5nm 整片晶圓、Etched Sohu 4nm、Rebellions/Furiosa 多 4/5nm;d-Matrix 刻意改走 TSMC 成熟 N6+Alchip 合作(避開先進節點與 HBM 售罄瓶頸);Samsung Foundry(005930.KS)為次要選項。先進封裝:TSMC CoWoS-S/L、Amkor(AMKR)、ASE 日月光(3711.TW)。HBM:SK hynix(000660.KS,CFO 明言 2026 全年 HBM 供應已售罄、緊俏延續至 2027)、Samsung、Micron(MU)。⚠ 2026 CoWoS 全售罄、2nm 已被預訂、總需求近 1M 片晶圓;Gartner 估 2026 >40% HBM 用於推論。小型新創無採購規模難搶長約配額——延遲一兩季,NVIDIA 就再鞏固一輪。絃外之音:Cerebras 以晶圓級 SRAM 規避外購 HBM、成為差異化賣點;但其餘多數新創(d-Matrix、Rebellions REBEL-Quad、SambaNova)仍需 HBM3E,與 NVIDIA 搶同一批貨。連結既有 cowos / hbm / chiplet_ucie 主題。
| 公司 | 市佔/地位 | 角色 |
|---|
| [TW] TSMC 台積電 (2330.TW) | 新創共同代工 | Cerebras 5nm 整片晶圓/Etched 4nm 等共用;2026 CoWoS 售罄、2nm 預訂滿 |
| [KR] SK hynix (000660.KS) | HBM 龍頭 | CFO:2026 全年 HBM 供應已售罄、緊俏延續至 2027 |
| [KR] Samsung(Foundry+HBM) (005930.KS) | 次要代工+HBM | 新創次要代工與 HBM 供應選項 |
| [US] Micron (MU) | HBM 第三供應 | 美系 HBM 供應商 |
| [US] Amkor (AMKR) | OSAT 先進封裝 | CoWoS 以外的先進封裝產能 |
| [TW] ASE 日月光 (3711.TW) | OSAT 龍頭 | 新創封測產能來源之一 |
資料來源
推論晶片新創(主節點) Inference Chip Startups
以差異化架構挑戰 NVIDIA GPU 的獨立推論晶片新創:wafer-scale、LPU、RDU、Transformer-only ASIC、in-memory compute、RISC-V AI、韓系 NPU。自有品牌、自賣晶片或推論雲。
架構分流挑戰 GPU:(1) Cerebras(CBRS)晶圓級 WSE-3(較 B200 大 58 倍、記憶體頻寬高 2,625 倍),2025 營收 $510M(+76%)、淨利 $87.9M(47% 淨利率,罕見獲利)、2026-05 IPO 募 $5.55B、開盤近 $350、RPO $24.6B(OpenAI >$20B、AWS 2026H2 商轉)。⚠ 2026-06-23 首份公開季報:Q1 核心營收 $191.3M(+92%)、核心毛利率 46.5%,但 Q2 毛利率指引驟降至 36–38%(一次性定價優惠退場+自租系統補產能)、FY26 指引 $855–865M——財報後股價自月初約 $240 重挫至約 $181,市場聚焦「成長換毛利」與 OpenAI 單一客戶集中($20B 合約=FY26 指引中位約 23×)。(2) Groq LPU(確定性資料流/SRAM,Llama 4 Scout >460 tok/s),2025 估值 $6.9B;2025-12 NVIDIA 約 $20B 非獨家授權 LPU、創辦人轉投 NVIDIA、2026-02 分配股東 $7.6B——挑戰者最諷刺結局:被龍頭「軟收編」。(3) SambaNova RDU 可重構資料流,估值由 $5.1B 腰斬至 $2.2B、Intel $1.6B 收購破局、裁員 15% 轉推論。(4) Etched Sohu Transformer-only ASIC(TSMC 4nm),2026 募 $500M/估值 $5B 但 2026-04 仍未出貨、無第三方 benchmark(純選擇權)。(5) d-Matrix Corsair in-memory compute,2025-11 募 $275M/估值 $2B(Microsoft 投)、2026-06 出貨、宣稱 10× 快。(6) Tenstorrent(Jim Keller)RISC-V AI,Qualcomm 傳 $8–10B 洽購。(7) 韓系:Rebellions(ATOM-Max/REBEL-Quad,2026-03 募 $400M/估值 $2.34B、韓首家 AI 晶片獨角獸、K-Nvidia 國家隊)、FuriosaAI(RNGD,2025 拒 Meta $800M、改靠 LG EXAONE、Series D pre-IPO 估值約 $2.3B)。新進:Positron(2026 募 $230M 成獨角獸)。2026-H1 新一波進入者(含首見歐洲玩家):MatX(前 Google、$500M、2027 出貨)、英國 Fractile(NATO Innovation Fund 投)、荷蘭 Euclyd(前 ASML CEO 背書、宣稱能效 100×)、Ayar Labs($500M 光互連);2026 全年新創募資已達約 $8.3B。⚠ 背離:資金狂熱但市佔反向——NVIDIA 推論市佔靠 Blackwell 由約 66% 升至約 74%、挑戰者整體反而失血,多數新創恐淪「募資成功、商業失敗」。⚠ 贏家極少;M&A 溢價/被收編為主回報路徑(Rivos 已被 Meta $2B 併、SambaNova 由 Intel 入股約 9%)。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] Cerebras Systems (CBRS) | wafer-scale 已 IPO 獲利 | 2026-05 IPO 募 $5.55B、開盤近 $350;2025 營收 $510M(+76%)、淨利 $87.9M;⚠ 2026-06-23 首份公開季報:Q1 核心營收 $191.3M(+92%)、雲業務 $79.8M(+167%)、核心毛利率 46.5%,但 Q2 毛利率指引驟降至 36–38%(一次性定價優惠退場+自租系統補產能)、FY26 核心營收指引 $855–865M(+~69%);財報後股價自月初約 $240 重挫約 16% 至約 $181;OpenAI 合約定案 $20B/750MW(至 2028)=FY26 指引中位約 23×(集中度未解、UAE 兩實體曾佔 86%) |
| [US] Groq (—) | LPU 最快推論 | 未上市;估值 $6.9B;NVIDIA 非獨家授權 LPU 結構為 2026 年底前分三期付約 $17B 現金、2026-02 已派股東 $7.6B;2026-05 再向既有投資人募約 $650M 支持推論雲轉型 |
| [US] SambaNova Systems (—) | RDU 可重構資料流 | 未上市;2026-02 完成 $350M Series E(Vista Equity/Cambium 領投),估值約 $2.2B(較 $5.1B 峰值腰斬約 57%);Intel 由 $1.6B 收購破局轉為策略股東持股約 9%(被併→被入股);裁員 15% 轉推論 |
| [US] Etched (—) | Transformer-only ASIC | 未上市;2026-01 募 $500M(總募資近 $1B)、估值約 $5B;已 tape-out 但截至 2026-03/04 仍未出貨、無第三方 benchmark、效能全為自報(純選擇權) |
| [US] d-Matrix (—) | in-memory compute | 未上市;2025-11 募 $275M、估值 $2B(Microsoft 投);2026-06 Corsair 進入全面量產放量出貨,採 TSMC 成熟 N6 製程+Alchip 合作(刻意避開先進節點與 HBM 售罄瓶頸);客戶約 90% 在美國;宣稱 10× 快、3× 低成本 |
| [US] Tenstorrent (—) | RISC-V AI(Jim Keller) | 未上市;Qualcomm 傳 $8–10B 洽購(約 4× 溢價)、6/24 投資人日或確認 |
| [KR] Rebellions (—) | 韓首家 AI 晶片獨角獸 | 未上市;2026-03 Pre-IPO 募 $400M、估值 $2.34B;韓國家成長基金 $166M;K-Nvidia 國家隊;2026末/2027初 IPO |
| [KR] FuriosaAI (—) | 韓系推論 NPU | 未上市;2025 拒 Meta $800M 收購;RNGD 較 GPU 快 2.25×;新增 OpenAI 合作(gpt-oss 120B 以 MXFP4 即時跑在僅 2 張 RNGD);目標 2026 出貨 2 萬顆 NPU;走獨立 2027 IPO,籌約 $500M Pre-IPO/Series D(Morgan Stanley/Mirae 顧問),估值約 $2.3B |
| [US] Positron AI (—) | 能效推論新進 | 未上市;2026 募 $230M Series B 成獨角獸;宣稱 ~3× compute/瓦 vs H100 |
| [US] MatX (—) | 新進入者(前 Google) | 未上市;2026-02 募 $500M Series B;前 Google 硬體團隊;主攻訓練 10× 效能;2027 才出貨(遠期選擇權) |
| [UK] Fractile (—) | 歐洲新進入者 | 未上市;2026 九位數募資、NATO Innovation Fund 投;英國玩家;仍在募資/未驗證 |
| [NL] Euclyd (—) | 歐洲新進入者 | 未上市;洽募 ≥€100M、前 ASML CEO 背書;荷蘭玩家;效能未經第三方驗證 |
| [US] Ayar Labs (—) | 矽光 I/O 新進 | 未上市;2026 募 $500M;光互連切入 AI 算力 |
資料來源
軟體堆疊 / CUDA 護城河 Software Stack & CUDA Moat
晶片再快,沒有軟體生態就難用。NVIDIA CUDA 是十年累積的開發者護城河;挑戰者各自靠自有編譯器/SDK 與開源 MLIR/Triton 突圍。推論工作負載標準化、可攜性高,是 CUDA 鎖定最弱的一環。
NVIDIA CUDA 為訓練端幾乎無解的護城河;但推論工作負載標準化、可攜性高,CUDA 優勢顯著收斂——這正是推論晶片新創的最大機會窗。各家自有軟體:Groq Compiler(確定性編譯)、SambaNova SambaFlow、d-Matrix Aviator、Tenstorrent TT-Metalium(開源)、Cerebras SDK。開源層 OpenAI Triton / MLIR 降低跨硬體移植成本,是「去 CUDA 化」的關鍵槓桿。絃外之音:編譯器層是 CUDA 鎖定真正鬆動之處;但企業遷移成本、kernel 調校與生態成熟度仍是新創的硬傷——YC 等已出現專攻 inference kernel 的新創(如 Cumulus Labs),顯示軟體層本身也在分工。NVIDIA 收編 Groq 的部分動機,正是吸走最強的推論軟體/硬體協同團隊。⚠ 2026-06-24 新變數:Qualcomm 以 $3.92B 全股票收購 Modular(Chris Lattner/LLVM 之父創,Mojo 語言+MAX 推論引擎為硬體無關「anti-CUDA」層),同時洽購 Tenstorrent($8–10B 未確認)——形成「RISC-V 自研晶片+開放跨硬體編譯器」全棧正面攻 CUDA;軟體層整併潮使「去 CUDA 化」由新創各自為政轉向大廠收編、商業化加速。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] NVIDIA (CUDA) (NVDA) | 軟體護城河壟斷·推論市佔約 74% | 十年累積開發者生態;推論端標準化使鎖定收斂但仍最深;Blackwell 較 Hopper token 成本低達 35×、每瓦 token 多達 50×,推論市佔由約 66% 升至約 74% |
| [US] Groq Compiler (—) | 確定性編譯 | 確定性資料流編譯,無需手調 kernel |
| [US] SambaNova SambaFlow (—) | 資料流軟體棧 | RDU 編譯與部署框架 |
| [US] d-Matrix Aviator (—) | 推論優化軟體 | 與 Corsair/JetStream 全棧整合 |
| [US] OpenAI Triton / MLIR (—) | 開源去 CUDA 槓桿 | 開源跨硬體移植層,降低 CUDA 鎖定 |
| [US] Modular (Qualcomm 收購) (—) | 硬體無關「anti-CUDA」軟體層 | Chris Lattner(LLVM/Swift 之父)創;一次寫碼跨 NVIDIA/AMD/Intel/Apple/Qualcomm 硬體執行;2026-06-24 Qualcomm 以 $3.92B 全股票收購、2026H2 結案——Qualcomm 同時洽購 Tenstorrent($8–10B 未確認)拼「RISC-V 晶片+開放編譯器」全棧攻 CUDA |
資料來源
推論雲 / 主權 AI 部署 Inference Cloud, Sovereign AI & Offtake
晶片透過自建推論雲、主權 AI 國家級部署、超大規模採購與 neocloud 觸達終端。大客戶/主權承諾是新創的營收錨點,也是最集中的風險。
部署通路:(1) 自建推論雲——GroqCloud、SambaNova Cloud、Cerebras Inference。(2) 主權 AI——沙烏地 HUMAIN/Aramco 採 Groq($1.5B 承諾、Dammam 全球最大推論資料中心)、UAE G42/MBZUAI 採 Cerebras(2025 曾佔其 86% 營收)、韓國 LG AI Research 採 FuriosaAI(EXAONE),且 2026-H1 FuriosaAI 新增 OpenAI 合作(gpt-oss 120B 以 MXFP4 即時跑在僅 2 張 RNGD、目標 2026 出貨 2 萬顆 NPU)——韓系新創在 LG 之外新增 OpenAI 開源模型作為錨定負載。(3) 超大規模——OpenAI 訂 Cerebras >$20B、Microsoft 投 d-Matrix、AWS 部署 Cerebras(2026H2 商轉)。(4) neocloud——General Compute 以 SambaNova SN50 建首個非 NVIDIA 推論 neocloud(連結 neocloud 主題)。絃外之音:主權 AI 是推論晶片新創繞過 NVIDIA 直銷限制、拿到大單的捷徑,但客戶高度集中——Cerebras 的真風險不是技術而是 OpenAI/UAE 單一交易對手;大客戶戰略生變即重傷,且中東客戶受美國出口管制牽動。
| 公司 | 市佔/地位 | 角色 |
|---|
| [US] OpenAI (—) | Cerebras 錨定大客戶 | 未上市;2026-06-23 隨 Q1 季報定案:多年 750MW 合約 >$20B(分批至 2028 上線)+ OpenAI 以 6% 年利貸 Cerebras $1B 建資料中心;該單約等於 Cerebras FY26 核心營收指引中位 23×——集中度因此更深而非分散(OpenAI 又同時為 Cerebras 股東) |
| [GLOBAL] HUMAIN / Aramco(沙烏地) (—) | Groq 主權 AI 大客戶 | 沙烏地主權實體(未上市);$1.5B 承諾;EMEA 最大 AI 推論算力;部署 OpenAI gpt-oss |
| [GLOBAL] G42 / MBZUAI(UAE) (—) | Cerebras 早期主權客戶 | UAE 主權實體(未上市);2025 曾佔 Cerebras 約 86% 營收(集中度風險) |
| [KR] LG AI Research(韓) (003550.KS) | FuriosaAI 企業客戶 | RNGD 較 GPU 推論快 2.25×、更省電;橫跨電子/金融/電信/生技 |
| [US] Microsoft (MSFT) | d-Matrix 投資+客戶 | Microsoft 創投基金 M12 投資;推論部署夥伴 |
| [US] AWS (AMZN) | Cerebras 雲部署 | 2026H2 商轉;把 Cerebras 算力納入雲服務 |
| [US] General Compute (—) | 首個非 NVIDIA 推論 neocloud | 未上市;2026-06 種子輪 $15M;$300M SN50 在手;鎖定 colo/礦場改造 |
資料來源
💬 留言討論 (0)
歡迎分享你對此供應鏈/個股的看法。需以 Google 帳號登入後留言;內容僅供研究討論,非投資建議。