國產AI大模型一體機,拿下中國智算半壁江山,能跑滿血DeepSeek

智東西(公眾號:zhidxcom)

作者 |  徐豫

編輯 |  雲鵬

智東西2月28日報道,今天在主題為讓ai更簡單的2025超雲產品技術大會上,北京智算產品及服務供應商超雲正式發布了最新的超雲ai大模型一體機系列,共有6款產品,分別為信創版和國際版的supercube 3000基礎版、supercube 5000企業版以及supercube 7000高級版一體機。

超雲方面多次強調,當前一體機的構建不能單靠簡單堆砌硬體,更多是一體化系統的硬體載體。其一體機產品結合了集約化高性能算力集群、智能算力調度引擎、一站式跟蹤服務,從端前端後、軟硬體協同、算力資源等方面提供一站式的ai大模型部署服務。

其中,超雲ai大模型一體機系列的多項軟硬體都可以自定義選配。以supercube 7000為例,一體機用戶可以選擇使用不同的晶元品牌、ai paas平台、雲跡運維平台等。

具體來看,目前超雲合作夥伴生態中,cpu領域的有飛騰、海光、英特爾和amd,gpu領域的有英偉達、寒武紀、崑崙芯、算能和天數智芯,雲服務領域的有騰訊雲、金山雲、阿里雲、曙光雲、西貝算力和中國電子云,大模型領域的有deepseek、智譜ai、阿里通義千問、位元組火山引擎、科大訊飛、元象、商湯、崑崙和即夢ai,應用場景領域的有中科天璣、浪潮數字、亞信安全、雲創大數據等15家公司。

超雲ai大模型一體機發布活動接近尾聲時,超雲還與深涌智能、中科天璣、雲創大數據、亞信安全等多家合作夥伴一同發布了《私域大模型部署白皮書》。

一、5大伺服器品類並行,應對企業私域部署6大難題

據超雲解決方案架構師董立鑫分享,當前企業的需求從部署底層大模型逐步進階為私域數據安全。

總體來看,企業現在有6大集中需求,包括數據安全、定製化需求、高性能與低延遲、合規性要求、成本控制以及模型穩定性與可控性。

因此,董立鑫稱,考慮到高安全性、高可控性、高靈活性等優勢,私域部署已成為大多數企業的優選。

而在私域部署過程中,企業通常會面臨算力選型難、模型優化難、數據導入難、資源管控難、部署運維難、工具應用難等問題。超雲ai大模型一體機系列則主要從算力、軟體、生態和服務方面應對上述問題。

具體來看,超雲方面算力定製的優勢在於支持核心算力按需定製,兼容海光、英特爾、amd等主流cpu多芯異構,以及軟硬體結合開箱即用。

同時,體系包容也是其一大優勢。超雲方面可實現deepseek等主流開源模型預裝和算力統一調度,並且圖形頁面操作簡單。例如,市場熱度較高的參數量671b的滿血版deepseek大模型,已接入超雲一體機產品。相應地,超雲一體機用戶可以開箱即用,不用額外花費時間、精力和金錢研究如何本地化部署滿血版deepseek大模型。

基於超雲的ai大模型一體機解決方案,其整機化交付落地時間縮短了60%,安全性增強了50%,全生命周期運維成本降低了30%,綜合性價比提升了30%。

目前,超雲的產品線主要有5條,分別是通用計算、加速計算、信創計算、數據中心產品、融合產品。其中,融合產品有集中式存儲、分散式存儲、超融合和網路交換機,超雲方面聲稱該產品線完全基於該公司自研的算力底座、軟體和解決方案構建。

另外,其加速計算產品線中的八卡機可適配英偉達最新的旗艦級gpu geforce rtx 5090。

二、信創客戶數破千,大讚deepseek激活ai生態

在超雲產品部副總經理任世傑看來,未來智算中心將會成為ai大模型能力的「放大器」,規模法則(scaling law)在當前ai發展中仍佔主導地位,因此充足的算力資源、更豐富的用戶類型和應用場景,會進一步推動大模型的普及和落地,並帶動數據中心、邊緣及端側算力建設。

例如,未來智能汽車、機器人、無人機、語音識別、圖像識別、虛擬現實等行業需要公有雲服務的支持,而政府、金融、能源、軍工、醫療、交通等行業更適合私有化部署。

任世傑稱,目前超雲信創客戶已超1000家,覆蓋黨政、金融、央企、能源、安全、互聯網等行業。

超雲總裁房玉震直言:「無論是企業,還是個人,如果現在不儘快學會用ai,很可能會被時代淘汰。」

談道春節期間爆火的deepseek,房玉震歸納了該開源模型的四大亮點。一是其強化學習、mla(多頭潛在注意力)機制、moe(混合專家模型)架構等技術的先進性;二是其1萬到200萬不等、較為低廉的調用成本;三是其開源模式極大降低了技術門檻;四是其簡潔促進了國產gpu生態的發展。在房玉震看來,deepseek加速大模型普及應用的同時,也刺激了ai生態的需求增長。

三、公司內部ai人均提效30%,對外聯動400餘家生態合作夥伴

作為ai生態中游的企業,超雲方面也在會上概述了該公司ai戰略和私域大模型部署經驗。

目前,超雲採取「all in ai和ai in all」戰略,成立了ai戰略工作組。同時,公司內部部署了超小雲私域大模型,代替了日常工作流中大量文書工作「paper work」。

其主要通過兩大指標考核部署私域大模型所帶來的效益,分別是人均銷售收入和人均利潤貢獻。

房玉震透露去年在公司在編人員人數沒有增加的情況下,公司銷售收入增長了36%;銷售出貨量增長了28.2%;人均效能提升了30%,部分超過50%。

對於公司ai提效成果,他打了個比方,「原本要做兩個月的工作,現在兩周就做完了」。

緊接著,超雲產品中心總經理田鋒進一步解釋了超雲的ai基礎設施布局。其主要有ai算力國產化、ai架構互聯化、ai算力快閃記憶體化、ai設施液冷化、ai平台系統化這5大理念。

ai算力國產化方面,超雲現兼容多個頭部國產ai cpu、gpu、npu平台,包括海光、飛騰、天數智芯、摩爾線程、燧原科技、崑崙芯、算能等,並推出了國產信創工作站、國產信創八卡機和國產信創oam訓推一體機。

ai機構互聯化方面,該公司現搭建了片間互聯、卡間互聯和集群互聯3種互聯方式。據超雲方面觀察,當前滿血版大模型是客戶首選,而蒸餾版大模型更多是行業內嵌。

ai存力全閃化方面,超雲自研了並行文件系統scfs,應用了低延遲的端到端rdma技術、pci-e gen5高速全閃和訓推一體,未來將兼容cxl全閃。基於此,其支持快速切換大模型,讀寫速度最高可達每秒23.3gb。

ai設施液冷化方面,該公司自研了冷卻液thermosafe「綠芯」,有效降低了能耗,本地化大模型部署噪音可從80分貝降至50分貝。田鋒舉了個例子,如果你在辦公室放置了一台超雲一體機,其液冷技術可以減少一體機帶來的噪音影響。

ai平台系統化方面,超雲現已搭建了數據管理體系、算力演算法管理體系、運維管理體系、ai數據管理軟體、ai paas調度平台和雲跡ai運維平台。

目前,超雲方面已聯合了超400家生態合作夥伴,開發了超600個解決方案,幫助超4000家客戶實現業務落地。

結語:中國智算市場行情火熱,一體機廠商或將吃到時代紅利

據idc統計,2024年中國智算服務市場整體規模達到50億美元;預估2025年中國智算服務市場整體規模將達到79.5億美元,2028年達到266.9億美元,2023年至2028年的年複合增長率將達到57.3%。其中,一體機是ai部署的一個熱門選項,也是超雲目前專註的賽道。

在行業調研中,聚焦推理市場,超雲的綜合實力位居國內伺服器品牌第八位,有較大的上升空間。隨著一體機市場和生態的不斷擴張,超雲有望憑藉其深耕一體機領域的成熟技術和經驗,成為ai領域的有力競爭者。