百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低!

2025年02月06日15:02:03 科技 1204

編輯:編輯部 HYZ

新智元導讀】國內首個自研萬卡集群,剛剛成功點亮!國產AI的高價門檻直接被打下來了。在百度智能雲平台上,DeepSeek R1和V3的官方價格直接低至五折和三折,基本實現全網最低。


在全世界都在加碼AI研發之際,國內傳來了一個振奮人心的消息——

百度智能雲成功點亮了首個自研萬卡集群。

這台由崑崙芯三代組成的「超級巨獸」,正式宣告中國在AI算力上邁出的重要一步。

這也成為DeepSeek後,本土化AI的又一重磅發布!

更令人期待的是,百度智能雲宣布將進一步擴大規模,計劃點亮3萬卡集群。

這不僅僅是一個數字的躍升,更是中國科技實力的又一次證明。

萬卡集群為什麼重要?


隨著o1、R1等「推理模型」的興起,測試時計算、強化學習等過程,讓模型的性能實現了持續性的提升。

與之相伴的,則是對算力更大的需求。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

為了讓自己的模型不在AI爭霸中落後,全世界的AI公司都在競相搶購GPU並爭取數據中心資源。

OpenAI曾與微軟達成了約140億美元的戰略合作,其中就包含了大量的算力配額。另有「星際之門」項目,4年5000億美元,要在全美建設20座超算。

Anthropic也獲得了亞馬遜80億美元的投資,其中包含了一個配備超10萬枚專用AI晶元的全新算力集群的使用權。

xAI擁有配備了超10萬塊GPU的全球最大超算——Colossus。並且,按照CEO馬斯克的設想,這一規模還將擴大到驚人的100萬塊。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

前段時間,納德拉曾在採訪中稱,今年微軟計劃在AI基礎設施中投資800億美元。

另有小扎公開表示,Meta將在今年加碼650億美元,全部用於人工智慧基礎設施的建設中。

昨天,谷歌公布的2024 Q4財報中,透露了計劃今年在AI競賽中斥資約750億美元,較上一年323億美元,大幅飆升。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

不難看出,在人工智慧scaling law進程中,亘古不變的是對算力的投資。

從這一點來說,萬卡集群的建成無疑意義重大。

首先,超大規模並行計算能力,可以實現訓練效率的躍升。

這樣,萬卡集群就能將千億參數模型的訓練周期大幅降低,讓AI原生應用快速迭代。

第二,它還能支持更大模型與複雜任務和多模態數據,支撐Sora類應用的開發。

第三,它還能支持多任務並發能力。通過動態資源切分,單集群就能同時訓練多個輕量化模型,通過通信優化與容錯機制減少算力浪費,實現訓練成本指數級下降。

而百度萬卡集群,就全面覆蓋了以上優點。

它就像一隻訓練有素的「天團」,通過智能調度和資源優化,讓訓練成本呈指數級下降。

百舸4.0開路


然而,組建這樣一支「天團」並非易事。

多芯混訓、激增的故障率等難題,成為萬卡集群部署過程中面臨的巨大挑戰。

可以說,從硬體到軟體,技術挑戰是全方位的。

百度的秘密武器在於——百舸AI異構計算平台4.0(百舸平台),專為十萬卡集群部署而設計。

它在2024年9月得到了全新升級,圍繞落地LLM全旅程的算力需求,在集群創建、開發實驗、模型訓練、模型推理四大方面,能為企業提供「多、快、穩、省」的AI基礎設施。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

首先,它突破了硬體的擴展性瓶頸,比如卡間互聯的拓撲限制,這樣,就避免了通信帶寬成為瓶頸。

同時,它還解決了萬卡集群的超高功耗與散熱問題。

可以說,百舸4.0就像是一位神通廣大的總指揮,因為採用創新散熱方案,讓集群不會因太熱罷工。

第三,它完善了模型的分散式訓練優化。

通過採用高效並行化的任務切分策略,它直接將集群的MFU提升至58%,讓每一分算力物盡其用。

第四,它大大提升了穩定性。

在這方面,百舸提供的容錯和穩定性機制,實現了98%的有效訓練效率。

百度自研的BCCL(百度集合通信庫)可以快速定位故障,並提供自動化容錯能力,將小時級故障恢復時間降低至分鐘級。

最後,百舸4.0針對機間通信帶寬需求,構建了十萬卡級的超大規模HPN高性能網路,優化拓撲結構,最終實現了覆蓋幾十公里的超大規模網路,讓帶寬有效性達到90%以上。

在通信效率方面,通過領先了擁塞控制演算法和集合通信演算法,萬卡集群完全無阻塞,並通過10ms級別超高精度網路監控,保障了網路的穩定性。

針對多芯混訓,百舸4.0更是展現出強大的資源整合能力。

不同地點、不同規模的異構算力,它都能進行統一管理,構建起「多芯資源池」。

當業務提交工作負載時,百舸能智能匹配最優晶元,基於集群的實時剩餘資源,動態選擇性價比最高的晶元執行任務。

這樣一來,能夠最大化利用剩餘計算資源,實現高達95%的萬卡多芯混合訓練效能。

在這個國產中,百度自研的AI晶元崑崙芯,也證實了自己獨特的技術優勢。

可以說,在百舸4.0能力的加持下,崑崙芯展現出了自己的生成式AI時代強大的競爭力。

這種突破性的創新,讓花旗銀行都為之驚嘆。

在其最新研報中,它將百度與DeepSeek並列,認為中國AI企業具備了高效低成本優勢,這將加速全球AI技術創新,推動2025年迎來AI應用的重要拐點。

2025,AI應用拐點將至

目前,基於百舸4.0,中國石化、中海石油、上交大、生數科技等行業龍頭企業和機構在自身業務場景中,為用戶提供了更加穩定智能的體驗。

AI視頻

以生數科技為例,最新Vidu 1.5大模型,僅需30秒,就能讓一句話變成視頻。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

提示:小男孩對著鏡頭笑,眨眼睛,手裡握著金色戒指

要知道,視頻大模型對算力、模型和數據的要求非常之高,這往往是困擾企業的核心難題。

而Vidu之所以能夠生成如此絲滑的視頻,背後便依靠的是百舸高效、穩定、混合多芯的能力。

在此過程中,百度百舸·AI異構計算平台為生數科技Vidu大模型提供了系統性、端到端的多模態大模型訓練支持。

得益於百舸在LLM訓練方面的硬核實力,Vidu訓練效率大幅提升,其素材渲染加速效率提升3倍,數據拉取效率提升51倍。

在短時間內,生數科技得以完成了Vidu的上線和開放API。

並且,無論是Vidu的文生視頻和圖生視頻,都保證了高動態性、高逼真度和高一致性效果。

而與生數科技的合作,只是百舸多模態能力的一個縮影。在未來,它還將為千行百業提供強大、可靠的多模態能力。

科研

在與高校上交大合作中,以百度智能雲核心能力,「全家桶」解決方案構建了AI for Science科學數據開源開放平台,率先在國內實現GenAI與科研場景的深度融合。

可以說,AI for Science科學數據開源開放平台是百度智能雲綜合能力的體現。

在算力層,通過百舸端到端優化的異構算力底座,為上交大科研人員提供訓練、推理網路的算力優化配置,實現訓練和推理加速,大幅提高了研究效率。

教育

另外,百度智能雲還為好未來自研的「九章大模型(MathGPT)」提供了關鍵支撐,推動大模型深入教育場景。

因此,好未來才能快速、方便地創建千卡級別的訓推任務集群。

具體來說,百度百舸·AI異構計算平台能實現單集群總量超過500TB,可為訓練任務的模型、數據載入提供高性能的數據讀取與傳輸保障,大大提升任務的時效。

面對不同的大模型訓練場景,平台還能在運行框架和實踐中,從計算效能、顯存策略、分散式並行策略等方面進行優化,提升模型訓練性能。

LLaMA2系列、GLM系列等多尺寸模型都達到了訓練指標,千卡任務加速比保持在90%,模型算力利用率(MFU)60%—70%,在有限的算力條件下,大幅降低了訓練時間。

如今,通過功能豐富、性能卓越的百度百舸·AI異構計算平台,「九章大模型(MathGPT)」已經廣泛應用於學而思旗艦學習機及多個業務場景中。

不久,我們將會看到更多基於百舸4.0加持萬卡集群的AI智能應用嶄露頭角。

萬卡集群點亮,國產AI迎來新時代



前有DeepSeek低價震撼全球,今有百度崑崙芯三代萬卡集群點亮。

從此,國產AI價格高、無法穩定應用等難題將一一破除,企業開發應用和產業創新的門檻,再一次被打下來了。

不僅如此,DeepSeek兩款最強模型R1和V3同時在千帆ModelBuilder平台上線,R1 API價格打骨折,V3調用打3折,堪稱全網最低。

而且,百度還提供了2周限時免費服務。

這一極具性價比的優勢,正是得益於百度智能雲萬卡集群的搭建。

百度首個自研萬卡集群點亮,上架DeepSeek直降3折全網最低! - 天天要聞

在AI發展戰略上,百度有著清晰的定位,即聚焦基礎設施建設

他們希望幫助更多用戶打造屬於自己的Sora,創造出無數個超級有用的多模態應用。

這條路線,也獲得了市場的認可。

去年1-8月,大模型中標項目數量已經達到2023年全年的5倍,不僅行業覆蓋廣泛,而且央企國企客戶佔比超一半。

作為中國驕傲,百度以強大的算力優勢和成本效益,為國產AI的發展再次注入新的活力。

中國AI,就是這樣擅長花小錢辦大事!

從此,不僅是AI行業,整個中國科技界和互聯網行業都將迎來全新的發展機遇。

科技分類資訊推薦

中國電信、中國移動、中國聯通,集體回應! - 天天要聞

中國電信、中國移動、中國聯通,集體回應!

通信行業電話營銷花樣百出,誘導升級、隱性扣費等現象依然存在。中國電信、中國移動、中國聯通16日對報道作出回應,三家表示高度重視,將開展全面自查,對於發現的問題堅決迅速整治,舉一反三,認真做好改進提升。
百度副總裁因女兒「開盒」孕婦致歉,隱私數據到底從何而來? - 天天要聞

百度副總裁因女兒「開盒」孕婦致歉,隱私數據到底從何而來?

極目新聞評論員 石平近日,多名網友發帖稱,一名微博網友自2024年以來,多次在飯圈「開盒」素人。3月上旬,其參與對一名孕婦網友的開盒網暴,同多人一起曝光對方工作單位並私信其丈夫進行辱罵,而根據該網友自己所發的微博信息,她疑似為百度副總裁謝廣軍的女兒。3月17日,百度副總裁謝廣軍發布微信朋友圈,承認涉事網友是...
小米生態鏈總經理刪除不做衛生巾微博,小米已有衛生護墊類商標,網友喊話雷軍:可以悄悄做 - 天天要聞

小米生態鏈總經理刪除不做衛生巾微博,小米已有衛生護墊類商標,網友喊話雷軍:可以悄悄做

3月18日,#小米生態鏈總經理刪除不做衛生巾微博#衝上微博熱搜。關於小米是否會生產衛生巾等產品,此前3月7日,小米生態鏈總經理陳波發文:「提前祝廣大女性朋友節日快樂,有什麼女性產品想讓我們做的嗎?(衛生巾真的做不了,大家可以許願家用電器類產品)」目前,這條博文已不可見。在近幾天的雷軍微博評論區,均有不少網...
百度副總裁女兒微博賬號自行申請關閉 - 天天要聞

百度副總裁女兒微博賬號自行申請關閉

近日,有傳聞稱,因為追星爭吵,百度副總裁謝廣軍女兒「開盒」別人,並曬出了自己父親月薪22萬的在職證明。三言發現,百度副總裁女兒的其中一個微博賬號已經自行申請關閉。此前,百度副總裁女兒一個微博賬號被禁言。
啄木鳥公布整改進度:已核實確認8655個爭議訂單,擬上線Deepseek問價 - 天天要聞

啄木鳥公布整改進度:已核實確認8655個爭議訂單,擬上線Deepseek問價

3月17日,啄木鳥家庭維修發布整改進度公示:截至3月17日18:00,已完成審核並核實確認8655個爭議訂單,針對其中的不合理收費,已完成退款、費用優化及補償。已完成88個產品、6758個服務項價格整理。3月27日前,完成「Deepseek AI 幫忙問價」功能開發,用戶可通過AI預估維修價格,並獲取小故障自檢與DIY維修指導,減少現場報...
覆蓋多個省市,廣電完成首批5G RedCap新型應急廣播終端技術試點 - 天天要聞

覆蓋多個省市,廣電完成首批5G RedCap新型應急廣播終端技術試點

IT之家 3 月 18 日消息,中國廣電昨晚宣布,其首批 5G RedCap(IT之家註:Reduced Capability,即輕量化 5G)新型應急廣播終端技術試點任務圓滿完成。據廣電介紹,此次試點工作覆蓋江蘇、上海、浙江、湖南、四川、廣州、雲南、河北、廣西等多個省市,攻克了終端適配、專網組網、應急廣播服務平台對接等多項技術難題。應急廣...
三星 AI 空調首秀,手機控制最高省電 30% - 天天要聞

三星 AI 空調首秀,手機控制最高省電 30%

IT之家 3 月 18 日消息,三星公司昨日(3 月 17 日)發布博文,報道稱於 3 月 17 日至 21 日在法蘭克福舉辦的 ISH 2025 國際建築系統展中,首次展出新一代智能家居與暖通空調(HVAC)解決方案。本次更新的亮點,在於搭載 AI 技術的 Bespoke AI WindFree 空調,用戶可以通過智能手機 App 控制,最高省電 30%
雷蛇靈刃 16(AMD)輕薄遊戲本未來將推 RTX 5060 顯卡低階版本 - 天天要聞

雷蛇靈刃 16(AMD)輕薄遊戲本未來將推 RTX 5060 顯卡低階版本

IT之家 3 月 18 日消息,根據 X 平台消息人士 188號 (@momomo_us) 發掘到的產品信息問價,雷蛇 2025 款靈刃 16(AMD 版)輕薄遊戲本將在現有 RTX 5070~5090 版本外再推出搭載 RTX 5060 筆記本電腦 GPU 的低階型號。▲ 發掘數據(最高配款定價存在錯誤,可能為 4199.99 美元)▲ 已發布版本可以看到
線上邂逅線下相守 社交平台婚戀新方式折射年輕人婚戀觀 - 天天要聞

線上邂逅線下相守 社交平台婚戀新方式折射年輕人婚戀觀

人民網記者 李棟金黃的菜花點綴綠野,早春的雨水滴落屋檐。在四川省德陽市中江縣,一場別開生面的婚禮正在舉行。婚禮現場,融合了蜀綉婚服、竹編裝飾、木版年畫禮儀道具等四川非遺元素,讓新郎小謝與新娘小黃的婚儀展現出傳統中式婚禮的浪漫和諧。兩人的相遇