ASIC:定制芯片经济学

華爾街見聞
2025.09.07 10:05
portai
我是 PortAI,我可以总结文章信息。

ASIC(定製芯片)經濟學的討論因博通提到的 Open AI 的 100 億美金訂單而重新升温。文章分析了 ASIC 與 GPU 的關係,指出最先進的 GPU 已高度特化,主要用於 AI 加速,實際上也可視為 ASIC。區分 ASIC 與 GPU 的關鍵在於商業模式,主要有商業芯片和定製芯片兩種選擇。自研芯片的誘惑在於高利潤,但成本也相對較高。

ASIC / 定製芯片不是新東西。

博通業績會上提到第 4 個 “神秘客户”(Open AI)的 100 億美金訂單,卻讓這個 “GPU VS ASIC” 的討論重新上了個高度。

趁着週末重新整理了一下 ASIC 的經濟學,和接下來芯片行業的一些敍事變化。文中借用了 TD Cowen 的一個分析框架,寫的挺好的。

自研芯片的 ROI 框架

1/ 哪有什麼 ASIC vs GPU,説白了大家都是 "ASIC”;

  • 傳統觀點裏,GPU 為了靈活性,犧牲性能;而 ASIC 則為特定任務優化,效率更高;這種框架現在已經沒那麼適用,因為最先進的 GPU 在芯片架構層面已經高度特化,大部分計算能力都用於 AI 加速,特別是矩陣乘法運算,與圖形處理關係很小;

  • 大語言模型 LLM 中,超過 90% 的計算都是矩陣乘法,這些芯片實際上都是為同一個特定應用(AI 加速)而生的 ASIC。(比如 NV 的 Tensor Core / 谷歌的 Matrix Multiply Unit / 亞馬遜的 Tensor Engine);下圖中黃色的這塊。

  • 某種程度上,大家都是搞 AI 的 “ASIC”;

2/ 區分 ASIC vs GPU 的本質其實不是技術路線,而是商業模式。用另外一種角度看,其實主要區別只有,

  • A. 商業芯片 (Merchant) 芯片廠搞,賣給很多人。
  • B. 定製芯片 (Custom) 雲廠搞,自己用。隨着 Google 之前傳出賣 TPU 的新聞之後,這個界限也開始模糊。

説白了,只是哪一個路線更加 “省錢” + 有長遠的戰略意義。

既然是從 “錢” 的角度出發,用 ROI 的框架來分析,可能會更加直觀一些。化繁為簡,只有兩種情況,“買”(buy)vs “自研”(build);

3/ “自研” 的誘惑 vs 代價

  • 商業芯片,利潤太高了(這裏不需要我贅述,大家都知道。看看 4 萬億市值的英偉達);80% 的芯片成本,都轉化成了英偉達的利潤。
  • 自研當然是為了吃掉這部分利潤,但是定製芯片是高度 “二元化”/binary 的。要麼成功,要麼失敗;並不存在説,我自研的芯片雖然垃圾,也能跑一跑的這種 “中間態”。

4/ 為什麼定製芯片 “不成功便成仁”?TD Cowen 這裏給了一個 “暴論”,只要你自研的芯片不能達到英偉達最先進芯片性能的 50%,那就通通都是電子垃圾,就算流片了,也不應該量產。

幾個基本假設(假設有點長,用灰色處理了),

  • 學習老黃用 “AI 工廠” 的概念去理解這個芯片投資;這個工廠的 “產品” 就是通過 API 調用生成的 “tokens”。

  • 市場存在一個公開的 “推理服務” 價格;OpenAI、Anthropic、Google 都在以 API 的形式提供其 LLM 服務,這個價格通常以 “美元/每百萬 tokens”($/1M tokens)來計費。

  • 硬件性能決定了 “產品” 的生產速度;一個 AI 芯片的性能,可以直接體現在它處理一個模型時每秒鐘能生成多少個 tokens,即吞吐量(Throughput, measured in tokens/second)。性能越強的芯片,生成 tokens 的速度越快。

  • 也就是説,收入/秒 = (價格/token) × (吞吐量, tokens/秒)

有了上面的假設之後,

  • 性能=算力=收入,AI 工廠的核心競爭力;一個性能是對手兩倍的芯片,在相同的時間內,就能產生兩倍的收入。

  • 目前市場上的 API 定價實際上是基於一個隱藏的共同基礎:它們絕大多數都運行在 NVIDIA 的 GPU 上。這使得 NVIDIA 的性能成為了市場定價的 “黃金標準”(其他人只能 “吞下” 這個標準)。

  • 換句話説,你的收入不完全是取決於你自己的芯片絕對性能,而是取決於你的芯片 vs 英偉達芯片的相對性能(因為英偉達定義了收入標準);

假設結束,直接上結論。(TD Cowen 的報告有一個很詳細的計算,這裏篇幅限制我直接跳到結論。)

  • 買老黃芯片的 IRR 很高,大概有 24% (大家不需要太較真這個數字,主要是解釋決策思路)。“買的越多,省得越多”;

  • 如果雲廠自研出來的東西,性能能達到英偉達芯片的 70% 表現,那麼 IRR 就可以有 35%(英偉達的利潤被省下來了,轉化成了成本節省,最終轉化成為 IRR);

  • 如果自研的東西,性能能達到英偉達芯片的 50%,那麼 IRR 剛好差不多,來到了臨界點。這個時候你仍然可以推進量產,因為有戰略意義。

  • 但是如果你自研的東西,性能僅僅能達到英偉達芯片的 30%,那麼 IRR 驟降(這裏不是線性的,因為電力,數據中心成本很多都是 fixed costs),那麼你應該果斷放棄自研,流片了也不要量產。在這個情況下,IRR 甚至比不上你公司的資金成本/WACC;(放在 Open Ai 語境下,他家拿的是 VC 的錢,WACC 肯定高過谷歌非常多);

用框架分析接下來的行業變化

我們姑且當做上面的假設和框架有些啓發,再來看看現在行業裏面發生的事情。

1/ 谷歌的 TPU 剛好來到了 50% 的這個臨界點,所以我們看到了這個季度 TPU 直接爬坡量產(疊加 Gemini 的需求驅動)。這也是為什麼 TPU 鏈上的東西,最近都這麼火熱。

2/ 博通宣佈的 Open AI 訂單,可能也已經過了 50% 性能的這個風水嶺,所以管理層提到訂單已經下來了。(我們之前公眾號提過,OpenAI 也是挖了很多谷歌 TPU 團隊的人);

  • 但是這個 “量產”,仍然有一個不確定性存在,那就是你需要確定你在量產的時候,你的芯片仍然能夠達到英偉達 50% 的性能(因為英偉達並沒有停滯,而是仍然在不斷加強他家的芯片能力。)

  • 這個 “量產” 不 “量產” 的決定,不取決於博通,不取決於 Open Ai,而是取決於量產的時候,兩者芯片的 “相對能力”,“相對迭代速度”。

3/ Open Ai 因為沒有了微軟這個奶媽,資金壓力更大。可能需要劍走偏鋒去靠定製芯片降低成本?這是 TI 週末的一個報道,

  • 3 個月前的預測,資金消耗量更小。
  • 現在的預測,資金消耗量更大,然後突然轉正。看起來就像是 “資本投入產生回報” 的故事。。用 ASIC 來給投資人畫畫大餅?

4/ 畢竟 Open AI 什麼都想做,也包括雲計算。

5/ 再看看收入端,最近都收入都沒調整。調的是遠端收入。。。畫餅策略一樣有跡可循。

6/ 最後貼一張 UBS 搞的,26 年 ASIC 路線 + 成本。

來源:180K,原文標題:《ASIC / 定製芯片經濟學(9 月 7 日)》

風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。