圖片系ai生成
6月6日消息,在2025智能經濟論壇上,百度集團執行副總裁、百度智能雲事業群總裁沈抖宣布,目前已有65%的央企選擇與百度智能雲開展深度合作,同時百度智能雲發佈千帆慧金金融大模型,並推出了覆蓋能源、交通、汽車、醫療、環境等領域的精選行業場景智能體家族。
百度摸索行業大模型,金融領域做試點
行業大模型是指基於通用大模型技術底座,在落地到特定行業時,針對特定行業需求和應用場景融入大量行業特定的數據和知識,從而在專業領域內表現出更高的準確性和實用性。
一個關鍵的問題是,行業大模型由誰來構建?
如果是垂直行業頭部廠商,領域內其他廠商可能心存顧慮,擔心自己的核心數據安全,以及是否會越來越落後於頭部廠商;如果是通用大模型廠商,核心數據從哪來,行業知識是否足夠,行業廠商能否認可,同樣是問題。
百度智能雲以自己積累較多的金融領域為試點,探索行業大模型的可行性。沈抖表示,基礎模型能力再強,直接放到具體的行業場景中,效果往往不達預期。
拿金融行業來說,金融對大模型的要求非常高,知識面廣、時效性強,而且對大模型的準確性和幻覺率要求更嚴格。通用模型因為缺乏專門金融語料的訓練,很難精準回答,容易出現幻覺。
更重要的是,真正有價值的金融數據,大多掌握在機構內部。企業想基於這些數據做精調,面臨兩個難題:一是效果好的基座模型,往往參數規模都是千億級,訓練一輪成本高、周期長;二是部署大參數模型需要大量算力,成本也很高。
他認為,大模型廠商基於金融專業語料打造「懂業務、夠專業」的行業大模型,在同等參數規模下,直接調用,效果遠超通用模型。企業還可以基於行業模型,進一步定製專有模型和企業應用,提高效果、降低成本。
因此百度智能雲以金融行業為試點,推出千帆金融行業大模型「千帆慧金」。在通用模型的基礎上,對研報、財報、專業書籍等海量金融數據做了深度清洗和挖掘,整理出數百億tokens的高質量金融領域語料,同時做了包括指令對齊、知識增強、訓練、推理策略等一系列優化。
在它的基礎上,針對行業複雜計算任務,百度智能雲系統優化了模型思維鏈,進一步研發了千帆慧金金融推理增強大模型。每個模型都提供大、小兩個版本,8b版本小參數模型,響應快、易部署,適用於意圖識別、指標抽取等對速度要求高、任務相對明確的場景;70b大參數版本更適合處理投研輔助、策略分析等複雜推理和多輪任務規劃問題。
這兩個模型都支持最長32k的上下文輸入,可以覆蓋金融行業絕大多數場景。在金融領域的多個數據集評測中,以百億參數規模實現了超過千億參數通用模型的效果。
智能體,大模型下一個戰場
沈抖表示,ai產品體驗不斷優化,正在從「能用」走向「好用」。越來越多的領先企業堅定攻關大模型,並且重點已經從最初的提示詞優化,走向了更系統化的智能體應用構建。
從行業視角觀察,2025年被認為是agent元年,可能並不是真正意義上智能體大爆發的元年,而是更多企業的投入重心轉為智能體領域。
這也與行業對大模型的認知加深有關,當面對複雜任務和多樣化的應用場景時,單純依靠提示詞已難以充分發揮大模型的潛力,例如一些需要模型自主決策、持續交互以及調用外部工具的場景中,提示詞優化難以實現任務,促使行業開始尋求更具自主性和智能性的解決方案。
諮詢機構idc預計,2025年生成式ai在企業的落地仍將優先聚集在辦公助手等提升生產力的場景,其次是行業垂直業務場景。金融、能源、零售、製造是最值得關注的傳統行業。從另一個角度,智能體將是大模型應用的重要方向,流程自動化,rpa,crm,數字員工將優先受益於智能體升級。
以能源電力領域為例,百度智能雲聯合國家電網打造了「營銷供電方案智能體」,用戶通過國網app提交需求後,智能體可自動識別意圖、拆解任務,調用專家模型和多種工具核驗信息、填報工單,並生成多套供電方案,支持動態優化與智能推薦。
在交通領域,百度發佈了「公路應急指揮智能體」,已在河北京雄高速落地使用,能高效識別如異常停車等突發事件,並快速生成處置預案,顯著縮短應急響應時間。該智能體通過大小模型協作,有效彌補了傳統小模型在連續狀態識別方面的短板,預警準確率提升至95%以上,體現了ai在複雜應急場景中的實戰價值。
沈抖表示,百度智能體已經針對行業場景做了深度優化,內置了特定的大、小模型、行業知識、行業標準流程和常用工具,對於同行業的客戶具備一定的通用性,百度智能雲精選「行業場景智能體家族」已在千帆平台全面上線。
「客戶、夥伴只需要對它們做一些輕量定製,就可以把這些能力快速嵌入到自己的業務系統。在我們和很多客戶的實踐中,『輕量定製行業智能體』,正在成為大模型產業落地的最快路徑。」沈抖說。
此外他提到,也有不少客戶希望進一步打造更貼合自身業務的智能體,從輕量定製走向系統化構建,此時需要考慮的三個關鍵問題是:怎麼開發、選什麼模型、用什麼算力。
在開發層面,百度智能雲千帆平台可提供企業級智能體工廠,客戶在千帆上可直接使用百度提供的成熟智能體,未來百度智能雲計劃通過a2a等協議,供客戶調用更多來自百度集團內部、上下游合作夥伴的第三方智能體;企業也可開發自己的智能體,通過mcp協議連接企業內外部的服務。
沈抖說,千帆不僅可以跑在公有雲上,也支持私有化部署。即使是私有化部署,也不會「鎖死」在某個版本。千帆的「私有化」本質是「私有化訂閱」嗎,每當模型或平台有重大升級,百度將新的更新推送到客戶業務系統。
模型層面,4月份百度發佈了兩款旗艦模型:文心4.5 turbo和對應的推理模型x1 turbo。文心 4.5 turbo的多模態理解效果提升超過30%,在多個測試集上追平甚至部分超越了openai的最新模型gpt 4.1,而價格只是gpt 4.1的6%,ds v3調用價格的40%。
算力層面,沈抖着重介紹了崑崙芯p800,採用了完全由崑崙芯自研的xpu-p架構,顯存遠超同類芯片,cuda上能跑的大模型,p800都可以跑,而且遷移成本非常低。
沈抖透露,2月百度點亮了p800的萬卡集群,4月點亮了3萬卡集群,在這麼大的規模上採用崑崙芯p800和海光cpu的全國產方案,屬於國內首個。目前國家電網、中國鋼研、招商銀行,以及北大、同濟等高校和互聯網企業,已經開始規模部署p800。
在崑崙芯之外,百舸還適配多款主流芯片,向下兼容各種芯片、屏蔽底層差異,向上也適配了各種主流的大模型框架,支持包括deepseek在內的國產開源模型的訓練和推理。
使用百舸+崑崙芯的方案,單卡吞吐性能相比國內主流芯片方案可以高出90%;大規模高並發模型推理速度可以提升40%以上。以百度和長安汽車共建的長安汽車智算中心為例,依託百舸平台和客戶自研的「星環平台」,集群平均算力使用率可以達到90%以上,綜合資源利用率提升50%。(本文首發於鈦媒體app,作者 | 張帥,編輯 | 蓋虹達)
更多精彩內容,關注鈦媒體微信號(id:taimeiti),或者下載鈦媒體app