國產AI芯片獲熱捧:推理需求爆發,產業鏈解題效率提升

旺盛的AI推理需求支撐下,國產AI芯片廠商業績支撐力大增。

21世紀經濟報道記者梳理髮現,目前國內AI芯片核心公司中,寒武紀連續六年虧損的紀錄在2024年四季度開始終結,並將這種趨勢延續到今年一季度;海光信息業績處在穩定態勢,在今年一季度更是實現合同負債大幅增長。

不過相比之下,聚焦在相對專用市場的AI芯片企業面臨階段性難題。景嘉微和龍芯中科在2024年度和今年一季度業績均面臨壓力。兩家公司不約而同提到在專用市場發展面臨瓶頸。

當然這也是目前國內AI芯片產業發展的不同切面,通用市場固然在經歷足夠積澱後,借力生態兼容能實現較快發展;專有市場的蓄力也必不可少。

近兩年來,超節點服務器、智算一體機等多種類型產品出現,也是在聚焦解決目前國產算力效率提升和應用落地難題。在智算產業鏈的多方聚力之下,國產AI芯片市場在圖謀更大成長空間。

圖片來源:創意製圖 梁遠浩

GPU巨頭六年扭虧

寒武紀終於擺脫連續六年虧損的泥淖,在2024年第四季度開始扭虧為盈,這一趨勢延續到今年一季度。這也是中國AI芯片公司業績正待釋放的一個縮影。

財報顯示,2024年度寒武紀實現營業收入11.74億元,同比大幅增加65.56%,而在2023年,公司營收同比還是微跌2.7%;全年歸母凈利潤為虧損4.52億元,虧損同比收窄46.69%,但在第四季度公司已經實現扭虧為盈,四季度凈利潤為2.72億元。

公告指出,收入增長的原因在於,期內公司持續拓展市場,助力人工智能應用落地,使得報告期內雲端產品線收入同比大幅增長。2024年雲端產品線占公司整體收入的99%,期內收入同比大增1187.78%,毛利率減少3.94個百分點。

考慮到公司報告期內境內收入佔比99.9%,意味着其正承接來自國內龐大的AI計算需求。

這一情況延續到了今年第一季度,財報顯示,期內公司實現營收11.11億元,同比暴增40倍,不過環比增幅有所下降。回看歷年寒武紀的業績不難發現,每年第四季度都是公司營收高點,因此一季度增幅有下滑在情理之中。收入增長原因是,公司持續拓展市場,助力人工智能應用落地。

期內凈利潤進一步扭虧,2024年一季度是虧損2.27億元,今年一季度盈利3.55億元,意味着凈利潤增長了2倍多(+256.39%)。

對於公司下一個季度收入的可持續性,可以從財報中進一步拆解。

寒武紀一季度財報顯示,期內貨幣資金大幅減少67%(6.52億元,上一季19.86億元),意味着用了大量資金做流片等投入型工作;應收賬款增加25.7%(9.73億元,上一季7.74億元),意味着其中有不少將轉化為後續季度的收入;存貨大幅增加55%(27.55億元,上一季17.74億元),後續也將陸續轉化為季度收入。

總體來說,多年虧損的寒武紀經過持續研發投入,疊加AI需求爆發和國內對採用自主芯片的需求趨勢下,業績正式迎來爆發。

不過寒武紀多年來都存在單一大客戶的潛在風險,年報顯示,公司近三年前五大客戶的銷售金額合計占營業收入比例分別為84.94%、92.36%和94.63%。其中第一大客戶占公司總銷售額79.15%。公告指出,該客戶為公司長期合作夥伴,本報告期內其大量採購,主要系公司的智能芯片產品競爭力不斷提升,在長期合作過程中得到客戶認可。

國海證券認為,公司存貨和預付款的高增長,體現出在當前國產芯片供應鏈不穩定的背景下,公司或具備了較好的供貨能力,為未來業務增長奠定基礎。

通用計算需求旺盛

產品線相對豐富的海光信息業績增長更為穩健,2024年度,海光信息實現營業收入91.62億元,同比增長52.4%;歸母凈利潤19.31億元,同比增長52.87%。

公告顯示,這是源於期內公司圍繞通用計算市場,不斷實現技術創新、產品性能提升。CPU產品進一步拓展市場應用領域、擴大市場份額,DCU產品快速迭代發展,得到市場更廣泛認可。加之國產化市場佔比進一步提升,促進了業績顯著增長。

這種趨勢也延續到了今年,第一季度公司實現營收24億元,同比增加50.76%;歸母凈利潤5.06億元,同比增加75.33%。

公告指出,公司產品競爭力保持市場領先,市場需求不斷增加,帶動公司營業收入快速增長。營收增長帶動了銷售回款增加,已簽訂合同的預收貨款同比增加較多。

財務數據中一個顯著的變化為,公司合同負債大幅增長,一季度為32.37億元,上一季度末為9.03億元,同比增長258.47%。一般來說,合同負債意味着客戶的預定合同款項,結合公司在此前年報中的表述,這意味着其為客戶提供的產品和服務將大增。

海光信息更多受益於其通用計算產品的布局。旗下產品包括CPU(通用處理器)和DCU(協處理器),後者就是一種GPGPU產品。

山西證券認為,從技術路線看,海光與英偉達同屬於GPGPU陣營,前者推出的DCU產品採用該架構有助於降低CUDA遷移難度並減少性能損失。目前大模型已經深入到AI芯片硬件層面做優化,達到芯片片上緩存大小優化的級別。因此,芯片架構會影響大模型以及上層AI應用的性能,而具有同樣架構的芯片,其模型和應用遷移的性能損失相對較小。

國海證券也指出,海光DCU具備自主研發的DTK軟件棧,是目前國內AI芯片生態中最為完備的生態之一,極大減少了應用遷移難度。

專用市場的挑戰

相比之下,此前多聚焦在相對專用市場的AI芯片公司短期內尚面臨業績壓力。

景嘉微2024年度財報顯示,期內實現營業收入4.66億元,同比下降34.62%;歸母凈利潤為虧損1.65億元,同比下降376.67%。

從整體業務構成來看,對業績帶來較大影響的是「圖形顯控領域產品」,該部分貢獻了公司整體收入的53%,年內實現收入2.45億元,同比下滑47.27%、毛利率同比下降17.91個百分點。

公告顯示,這一類目的產品分為圖形顯控模塊產品和加固類產品,目前主要應用於專用市場,將不斷開拓在通用市場的應用,已在針對更為廣闊的車載、船舶顯控和通用市場等應用領域,持續研發並提供相適應的圖形顯控模塊及其配套產品。

芯片領域產品」是其中唯一實現收入同比增長的業務,年增速33.72%,毛利率同比下滑6.03個百分點,但下滑幅度高於公司整體毛利率承壓水平。該業務主要指公司GPU芯片帶來的相關收益。

這兩類業務共為公司貢獻了八成收入。公告顯示,公司全力推進由「專用」到「專用+通用」的發展戰略,持續開展高性能GPU、模塊及整機等產品的研發。

龍芯中科長期以來推動自主指令集架構LoongArch,因此其生態搭建需要一定時間進行積累,應用落地也呈現逐步拓展行業應用的路徑。

不同於目前市場上生態建設已經相對成熟的x86和Arm體系,龍芯的目標是打造第三套生態系統,其邏輯與目前活躍的RISC-V略有接近,但推進情況也有所不同。據稱,LoongArch在服務器、桌面、終端、工控等通用領域得到日益廣泛的應用。

2024年公司實現營業收入5.04億元,同比微降0.28%;歸母凈利潤為虧損6.25億元,相比2023年虧損幅度擴大了2.96億元。

公告顯示,2024年是龍芯開展生態建設和面向開放市場三年研發轉型(2022年~2024年)的決戰之年。期內,公司在具有傳統優勢的安全應用工控市場停滯,導致該業務營收大幅下降的情況下,緊抓電子政務市場開始復蘇的時機,發揮公司新產品的性價比優勢,信息化類芯片營收大幅增長,推動下半年公司營收重新進入增長周期。

財報顯示,2024年公司信息化類芯片產品實現收入2.69億元,同比增長193.70%,帶動毛利率回升到26.99%,但固定成本分攤的影響仍在,加之報告期內與桌面CPU配套出貨的橋片成本較高,進而影響毛利率仍未恢復至理想水平。工控類芯片產品受安全應用領域需求仍未恢復的影響,實現營業收入0.90億元,同比下降44.56%,毛利率也因同一因素下降為49.93%、同比減少17.56個百分點。

一種行業觀點認為,國內高水平的計算技術體系採取了不同技術路線,其中「高鐵模式」,即源頭創新來自海外,強調「全兼容」,從應用發揚光大,海光就是其中代表;「北斗模式」則強調「全自主」,這條路線也很重要,但畢竟是從頭做起,生態建設將經歷較為緩慢的過程,典型案例就是龍芯、寒武紀等。

競速智算生態

當前國產AI芯片需求旺盛的另一面是,DeepSeek旗下模型產品引起關注一定程度起到了重要作用,這也點燃了AI推理的應用需求。

在今年初,眾多國內AI芯片廠商先後宣布實現與DeepSeek旗下不同模型陸續展開適配工作。

海光信息就指出,因其DCU芯片採用了GPGPU通用加速計算架構,DeepSeek模型可直接在DCU上運行,並不需要大量適配工作,技術團隊的主要工作是進行精度驗證和持續的性能優化。

CIC灼識諮詢高級諮詢顧問張笑璐對21世紀經濟報道記者分析,眾多國產AI芯片廠商與DeepSeek的快速適配潮是中國芯片實現國際化突擊的第一步。DeepSeek對於中國AI芯片廠商的利好非常確定,通過合作,中國芯片廠商加速了深度學習框架和分佈式訓練適配,推動了中國的「國產算力+國產大模型」閉環生態。

「性能表現角度看,DeepSeek推理任務表現與OpenAI媲美,甚至在部分任務有所領先。這使得國產AI芯片在推理端可以快速實現商業化,同時說明了國產AI芯片替換英偉達GPU非常可行。」她續稱,「當然,訓練端國產芯片與英偉達的差異依然存在,在更複雜的模型訓練場景下,國產芯片還需提升。此外中國AI芯片生態仍然面臨挑戰。」

伴隨AI推理需求日益活躍,更適配私有數據邊緣端運行的智算一體機產品也先後被推出,據統計,目前市場上已經有超過一百款一體機產品,但也面臨應用良莠不齊的情況。

有業內人士對記者指出,目前國產一體機產品多已經實現了「可用」,但做到「好用」還需要持續推進性能優化工作,並豐富產品形態。

根據中國信通院官方披露,今年4月,相關團隊已經啟動訓推一體機測評工作,除了對通用模塊進行測試,同步還推出能力子域單項測評。

不止於此,智算產業鏈還在尋找能更好提升計算效率和傳輸速率的路徑。

前不久,華為發佈了基於新型高速總線架構的CloudMatrix 384超節點集群。海通證券指出,該架構採用全對等互聯總線和共享以太網技術,將資源互聯帶寬提升了10倍以上。

「英偉達此前提出了這一理念,我們也認為,超節點是一個重要方向。」一名通信行業人士對21世紀經濟報道記者分析,其核心要點在於,將數據傳輸儘可能放在芯片內部,不行再到機內、卡間去解決。「但最終還是要看在什麼場景下如何解決問題,最終讓計算能力多快好省地釋放。」

更多內容請下載21財經APP