“求寒武紀原廠銷售資源!”、“找做沐曦的朋友,有個項目急詢報價!”
算力市場的風向,正悄然生變:沒等來英偉達B200的火爆行情,反倒見證了國產算力的逐漸崛起。
“今年公司一定會落地國產算力項目,目前正在與一家已過會的國產芯片企業深度洽談。” 頭部算力租賃公司項目負責人林海的話,道出了行業內的普遍共識。
據雷峰網了解,這一行業共識已在頭部企業落地生根:某頭部互聯網廠商已經完成全系列國產芯片適配測試,并規劃將部分業務場景切換至國產方案。這樣的動作并非個例,而是各大廠商基于供應鏈安全與業務發展需求,形成的集體選擇。
市場端的迫切需求與企業層面的主動布局相互呼應,資本端也在迅速跟進。雷峰網了解到,國內唯一專注于集成電路產業的融資租賃公司,正在推進一個國產算力項目的放款。更多國產項目落地信息,歡迎添加作者微信 YONGGANLL6662 互通有無。
金融機構對回報的測算向來苛刻,而這筆資金的注入,恰恰印證了在政策補貼的加持下,國產算力已具備商業化可行性。
據公開資料顯示,國產算力項目商業化進程正在加速:科大訊飛與華為聯合打造的國產算力集群,在MoE模型訓練上實現93%的效率;寒武紀MLU系列芯片邁入三大運營商的算力資源池;中科院部署了4096張沐曦算力卡,共計984P算力;螞蟻集團已部署萬卡規模的國產算力集群,訓練任務穩定性超過98%。
商業化的扎實進展、國產替代的高度共識,正推動一二級市場對國產算力賽道的熱情全面釋放。
2025年7月,曦望宣布完成近10億元人民幣的Pre-A輪融資,昉擎科技宣布完成總計數億元人民幣的天使輪融資;10月,AI算力芯片創業公司玉盤完成天使輪融資,投資方為源本基金。摩爾線程、沐曦已進入IPO最終決賽圈,一級市場又涌現出哪些新的優質標的?歡迎添加作者微信 YONGGANLL6662 交流更多信息。
二級市場更顯火爆,算力及半導體板塊成為領漲主線,中證半導體產業指數近三個月上漲42.48%,寒武紀、海光信息等核心企業股價年內實現翻倍,半導體設備、國產芯片ETF頻繁異動拉升。
外資機構也敏銳捕捉到這一市場信號。據雷峰網了解,多家外資機構正加速入場調研國內算力產業,國產芯片正是其布局核心。
這一趨勢已直接傳導至市場交易端,與國產算力的替代浪潮形成鮮明對比的是,曾經炙手可熱的英偉達設備,已難現往日火爆行情。
“純靠倒貨賺差價?現在這行情還不如把錢存銀行穩當。” 服務器經銷商張翔的話道出行業現狀,“2023年,一臺A100轉手就能賺十萬,現在除非你是一手貨主,不然賣一張4090也就賺200塊錢。”
微薄利潤讓不少跟風涌入的從業者鎩羽而歸。“沒人覺得做英偉達設備貿易還有盼頭,要么轉頭銷售國產算力,要么回歸老本行,很多從通信行業下場的人,已經重新回去賣帶寬了。” 張翔補充道。
更讓人頭疼的是交易中的信任危機:定金詐騙、期貨違約屢見不鮮,海外供應商潛逃導致維權無門的案例不在少數,甚至出現“交款后保管對方網銀及U盾”的極端信任方式。當曾經的“香餑餑”變成高風險、低回報的“燙手山芋”,市場目光已轉向更具穩定性與發展潛力的國產算力賽道。
此前,國產芯片一直面臨諸多質疑。如今,政策支持、技術迭代與市場需求如何形成合力,讓國產芯片正一步步成為“可選項”?未來的算力江湖,又將迎來怎樣的格局重塑?
01、最高補貼達80%,國產算力與英偉達的「性價比差距」逐漸彌合
“7月份,我們總部發布了一份西北地區算力項目清單的文件,要求各地分支機構對口援助西北地區的算力項目。”某大型金融機構算力項目負責人表示。
這并非個例。據悉,多家大型國有金融機構或已接到相關通知,要求對八大節點的算力項目開展針對性幫扶,尤其向國產算力項目傾斜,不僅提供專項資金,更主動降低資金獲取門檻,解決“資金難”的問題。
除了引導社會資本加碼支持,實打實的補貼政策,更成為彌合國產算力性價比差距、撬動市場選擇的關鍵“杠桿”。
曾經,國產算力深陷商業邏輯的困境:相關測算顯示,英偉達每P算力價格約12.5萬元,而國內頭部芯片廠商每P算力價格達35萬元;更關鍵的是能耗差距,同等算力需求下,國產設備需投入更多臺數,單臺能耗也更高,整體能耗是英偉達的3-5倍。在純市場驅動的情境之下,幾乎沒有理由采購國產算力設備。
如今,補貼政策正打破這一僵局:北上深杭等承擔國家人工智能發展任務的城市,可享受40%的國家全額補貼,若疊加地方政府的補貼,最高補貼金額可達項目總投入的70%-80%,此類項目多由“國家隊”操盤落地;八大算力節點城市則是獲得10%-15%的基礎補貼,疊加超長期國債與地方補貼后,力度最高可達40%。
“早在數月前,我們就接到了發展國產算力的文件,國產化已是明確方向。” 國產智算中心負責人陸柯直言。其負責的智算中心以華為昇騰910B芯片做為算力基座,根據客戶所簽訂的合同時間以及需求數量,設備月租價格在2-3萬元浮動,而該中心所在的西部城市,推出市、區兩級消納補貼,區級補貼50%、市級補貼 60%。
這意味著,若消納100萬元算力服務,最低實際僅需支付40萬元,對需求方而言吸引力十足。
為杜絕套殼騙補,各地也明確了消納方資質要求:要么是互聯網大廠等指定主體,要么是在當地注冊且形成一定規模的企業,唯有帶動當地GDP增長,繳納稅款的主體才能拿到補貼。
值得注意的是,據雷峰網此前首發報道,最新“窗口指導”文件明確要求:有補貼等地方力量參與的項目,需全部使用國產芯片;即便部分項目已開工建設,若當前進度較低,仍可要求拆除已使用的國外芯片。
從金融機構的定向幫扶、梯度化的補貼激勵,到“國產化優先”的明確要求,政策端正從資金、市場、規則多維度發力,為國產算力掃清障礙。歡迎添加微信 YONGGANLL6662 交流更多國產芯片最新政策動向。
02、英偉達并非推理場景「最優解」,國產方案性價比更高
政策護航并非從國產芯片誕生之初就已經制定,而是隨著技術、產品以及應用場景的逐漸成熟,在關鍵節點順勢發力。
“這次國產算力熱潮與上一輪周期存在顯著差異。” 并行科技國產事業部負責人宋志方直言,“五年前的熱潮更多聚焦于資本層面,應用場景相對稀缺,而DeepSeek等模型的落地,讓國產算力真正進入行業視野,下游需求的爆發式增長形成實質性帶動。更關鍵的是,國產芯片廠商已經完成2-3代產品迭代,達到了可對標英偉達主流卡水平。”
寒武紀以思元系列構建云邊端全棧布局,軟件平臺Cambricon NeuWare全面兼容最新PyTorch版本和Triton算子開發語言;沐曦發布首款全國產通用GPU曦云C600,推出MXMACA軟件棧技術體系,單機16卡即可支持百任務毫秒響應;摩爾線程S5000性能追趕業界領先水準,依托MUSA架構,實現第三代產品達成千億參數大模型高效訓練。
在諸多應用場景中,推理需求的爆發將成為國產算力最重要的突圍窗口。
外界看來,模型的迭代速度放慢,而殺手級的應用也暫未出現,由此判斷算力需求正在階段性停擺。事實上,以搜索為例,每一次搜索都在產生推理的需求,互聯網形態已經被AI重構。
火山引擎總裁譚待披露,豆包大模型日均Token用量從2024年5月的1200億飆升至2025年9月的30萬億,增幅達253倍。更具行業代表性的是,全行業推理Token總用量較2023年已實現300倍躍升。
沙利文分析相關數據顯示,2028年中國推理算力市場規模將達2931.2億元,行業對于推理技術進步有著迫切需求。AI推理需求何時爆發?哪項推理優化技術更為高效?歡迎添加微信 YONGGANLL6662 互通有無。
明確的需求之下,推理任務的技術特性為國產算力提供了精準適配的空間。
推理任務多采用Decoder架構,其核心邏輯是單個查詢向量(Query)與鍵向量(Key)、值向量(Value)進行注意力計算(Attention),單次輸出一個Token,本質是通過單個Token與靜態參數開展局部計算。這意味著推理無需盲目追求“極致計算性能”與“訓練級超大容量HBM”,而應精準匹配場景需求,以支撐大規模、低延遲的推理業務落地。
針對推理應用場景,國產芯片廠商正在不斷迭代方案。
華為基于910B的硬件特性,在DeepSeek部署場景中開展了大量探索,推出針對性的專家并行方案,實現大規模推理業務的性能加速。專家并行方案顯著降低了單卡顯存占用,并將單卡并發能力提升至3倍,使企業能夠在相同算力投入下獲得更高的推理吞吐量。
此外,高顯存是國產芯片在推理場景中的核心優化方向,910B搭載64GB顯存,平頭哥與昆侖芯的相關產品則將顯存容量提升至96GB。
除了硬件產品本身的性能與配置升級,推理場景對算力彈性與成本優化的需求,還推動了異構集群的落地應用。多元算力協同的模式,進一步拓寬了國產芯片的生存空間。
“針對推理業務,年初行業對PD分離技術抱有高度期待,PD分離技術本身能帶來的性能優化大約是20%,但其優勢在于能將推理過程中的Prefill階段(計算密集型)與Decode階段(顯存密集型)拆分開來,這不僅保障了大規模部署的可行性,也為兩個階段的差異化適配與優化創造了條件。” 宋志方表示。
據悉,天數智芯天垓150與英偉達H20組成的異構集群,已成功應用于DeepSeek的大規模推理部署場景,天垓150作為P節點,專門承接計算密集型任務處理,配備141GB顯存的H20作為D節點,專注承載顯存密集型相關工作。
“搭配國產芯片和英偉達芯片的方式去實現PD分離,對比純英偉達方案,在能耗以及成本方面一定是更優的。”宋志方表示,“一般會認為英偉達的解決方案是最優解,但從代碼的角度講,Prefill階段的每次請求計算量都很小,采用性能更強的芯片,計算速度會更快,但無法發揮芯片的完全的計算能力,因此采用國產芯片反而性價比會更高。”
03、渠道封閉、產能受限、需求放量,國產芯片步入「賣方市場」
隨著應用場景的持續成熟,國產芯片的市場需求日益清晰。
“一款芯片能不能真正跑通市場,核心在于能否抓住需求爆發的窗口,用戶愿意為產品買單才是最根本的邏輯。” 前芯片廠商研發專家楊濤表示。
這一說法,在當前的AI芯片市場的增長態勢中也得到了充分印證。
“國內AI芯片市場正進入高速增長通道,每年增長50%的判斷相對客觀,甚至有望達到70%-80%的增速。”服務器廠商資深專家夏雨補充道,“這一強勁增長的核心驅動力,來自推理算力需求的持續釋放與多模態應用的全面爆發。”
此前長期以英偉達為核心的算力貿易,在政策、技術及市場等因素的影響之下,已逐漸讓渡份額給國產芯片。
“芯片貿易門檻不高,可復制性極強。”張翔直言,“以當前的B200設備為例,如今市場行情已高度透明,無論是貿易商還是終端客戶,都對設備基準價格及合理利潤空間了如指掌,不存在信息差帶來的額外收益。”
不少從業者表示,當前售賣最新款英偉達設備能實現10萬元毛利已屬可觀,其投入產出比已遠不及從前。
相比之下,國產芯片獨特的分銷體系與市場特征,使得其貿易環節的信息透明度相對較低,客觀上為貿易商保留了更穩定的利潤空間。貿易商的轉向,也將進一步激活國產算力生態。
獨特的分銷體系,核心以“公對公”合作為主,一方面,受限于產能供給,頭部大客戶的需求已能充分消化國產芯片廠商的現有產能,以某頭部芯片廠商為例,其采用白名單供應機制,僅向大型企業及國企開放合作。另一方面,AI芯片對技術服務的依賴度極高,在多數應用場景中,后續的技術支持、模型適配等服務僅能由芯片原廠提供。
“直銷是目前最好的方式,因為貿易商普遍不具備技術服務能力,且國產芯片多為項目制,芯片原廠直接對項目負責。”某國產芯片廠商市場負責人鐵云表示。
這一模式下,芯片廠商在服務器硬件適配方面也有著清晰的合作布局。
據悉,寒武紀合作的服務器廠商為浪潮,昆侖芯合作服務器廠商為新華三,從芯片廠商的角度,一般會選擇1-2家服務器廠商進行合作,一般是1家大型OEM廠商為主,幫助芯片廠商定制機型,再搭配一個規模較小的服務器廠商作為儲備。
值得注意的是,即便服務器廠商是芯片廠商的關鍵硬件合作方,其技術服務能力仍難以達到原廠水準。因此在實際合作中,涉及技術支持、模型適配等核心環節,仍需芯片原廠直接介入。這也決定了最終的銷售路徑并非由服務器廠商直接出貨,而是由服務器廠商完成硬件組裝后,再由芯片原廠主導銷售與后續服務。國產芯片分銷體系的更多玩法與內幕,歡迎添加微信 YONGGANLL6662 交流探討。
此外,國產芯片的貨源不易在市場上流通,還與服務器廠商的備貨邏輯密切相關。站在服務器廠商的角度,通用性較低的產品市場接受度低,客戶需求差異大,一旦備貨后未能及時售出,極易造成庫存積壓;而通用性強的產品可復制性更高,更易實現規模化銷售,因此很多通用性低的產品,服務器廠商通常沒有備貨,進而導致流入市場的國產設備數量減少。
國產芯片公司也會儲備經銷商,但僅限于分銷部分中低端型號的產品,以及負責服務中小客戶,而且做為代理,也能起到為國產芯片廠商墊資的作用。
直銷主導的銷售路徑、服務器廠商對通用性不足產品的審慎備貨,再加上經銷商僅覆蓋中低端型號的分銷局限,多重因素疊加,國產芯片逐步走入賣方市場。
04、國產算力市場新局面:窗口期競速、超節點破局、價格逐漸下探
當下的國內算力市場正迎來洗牌期,A100淘汰換代、推理需求爆發都將為國產芯片的發展提供窗口期,這也不可避免的讓國產芯片迎來最激烈的競爭期。
在這一背景下,市場對國產芯片的落地效率提出了更高要求。
“一款芯片產品量產推向市場后,若一年內仍未能形成商業化批量采購,本質上意味著產品商業化落地不成功,因為考慮到半導體行業的高速迭代,市場留給企業實現規模化落地的窗口期,往往僅有一年到一年半時間。”鐵云表示。
而要在短窗口期內快速突破市場、搶占份額,單純比拼單卡性能的傳統路徑已難以為繼,系統整體效率與規模化部署能力的重要性日益凸顯,最直接的表現便是催生了超節點產品的崛起。
目前國內超節點產品生態逐漸豐富:昇騰384超節點集成384顆昇騰910C AI芯片和192顆鯤鵬CPU,通信帶寬提升15倍,支持數萬卡集群擴展;平頭哥磐久AL128超節點單柜集成128張加速卡,實現訓練端到端加速比3倍提升;中科曙光scaleX640超節點實現全球首個單機柜640卡超節點,MOE大模型訓練效率提升30%-40%。
“超節點是AI時代的基礎設施形態,其解決高效通信的問題,讓集群的效率大幅提升,也就變相的降低了成本,原先1000張卡才能實現的效果,現在或許500張就足夠了。”夏雨表示。
超節點的核心競爭力體現在兩方面:一是芯片本身的性能表現,二是互聯鏈路與架構的優化能力。盡管國產芯片單卡性能與英偉達存在差距,但國內廠商在網絡互聯技術領域具備差異化優勢,通過擴大工程化集成規模,實現了整體性能的彎道超車。
要將這種優勢轉化為市場份額,定價策略與市場鋪設節奏成為關鍵。
相關行業人士透露,頭部廠商的單套超節點產品落地價約7000-8000萬元,目前廠商為加速市場滲透、快速鋪開應用場景,持續下調價格,部分項目折扣力度可達五折。
“芯片行業本身具備較高利潤空間,英偉達相關產品毛利約70%,即便適度讓利甚至以低毛利策略拓展市場,仍具備可持續性。”夏雨表示。
此外,超節點作為硬件集群形態的創新,其性能發揮與規模化落地,最終離不開軟件生態的深度協同。
軟硬件協同是國產AI芯片的重要考題:在生態層面,國產廠商仍處于“各立標準”的分散狀態,華為昇騰依托MindSpore框架與Ascend API,寒武紀則基于Cambricon NeuWare平臺打造專有接口,沐曦、壁仞等也需適配PyTorch/TensorFlow的自定義算子接口。
這種“無統一標準”的現狀,導致開發者若想在不同芯片間遷移模型,需重新做算子適配、性能調優,甚至修改底層代碼。以千億參數大模型遷移為例,從英偉達GPU轉向國產芯片,往往需要1-3個月的適配周期,這正是生態建設門檻高、壁壘深的核心原因。
鐵云認為,AI領域尚未形成類似圖形計算領域DirectX、Vulkan的全球通用標準API。若未來行業能誕生統一的API標準,將大幅降低生態建設門檻,打破當前不同技術路徑下的生態壁壘,屆時生態競爭格局或將迎來根本性改變。
需求爆發、市場交替、技術迭代的周期變化之下,美元基金投資人張音表示,“明年,AI產業的關注重點將回歸算力基礎設施投資建設。”國產算力熱潮,不是短期資本炒作的 “風口”,而是技術迭代到一定階段、需求積累到特定程度的必然結果。
作者長期關注算力與芯片產業,歡迎添加微信 YONGGANLL6662 交流更多信息。
注:文中林海、張翔、楊濤、夏雨、張音均為化名。
本文鏈接:國產推理芯片,贏了英偉達?http://www.sq15.cn/show-3-159149-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。