
該項目案例由商湯科技投遞並參與數智猿×數據猿×上海大數據聯盟共同推出的#技術向善·榜樣的力量#《2025中國數智產業最具社會責任感企業》榜單/獎項評選。
隨着科技革命和產業變革深入發展,智算中心作為支撐數字經濟與科技創新的新型基礎設施,在經濟社會高質量發展過程中發揮着重要作用。2023年12月,國家發改委等四部門發布《關於深入實施“東數西算”工程加快構建全國一體化算力網的實施意見》,文件首次提及“算力電力協同”概念,並將創新算力電力協同機制列為重點任務。
算力作為數智時代的新質生產力,是推動數字經濟發展的重要引擎,電力作為算力發展的重要基礎資源,深刻影響着算力發展的規模和成本。人工智能是算力爆發性增長的主要驅動力,未來隨着人工智能廣泛應用算力需求將不斷攀升。中根據國際能源署(iea)相關數據顯示,全球數據中心、人工智能等相關電力需求將從2022年的460太瓦時上升至2026年的620—1050太瓦時。根據國家數據局統計,截至2024年末,我國在用算力中心標準機架數超過 900萬架,算力規模達到280eflops,算力總規模較2023年末增長16.5%。
隨着芯片架構性能的不斷提升,功耗的增加也變得尤為顯著。為應對芯片功耗增加帶來的問題並保證算力能夠高效且大規模地運行,兩個關鍵因素是高性能芯片和穩定的電力供應。算力中心的本質在於將電力轉化為算力,也就是將瓦特轉換為比特,這一過程是數字經濟發展的基礎。因此,如何提高數據中心的能效,減少能耗,成為行業發展的關鍵問題。
在數字經濟發展和“碳中和”目標任務的雙重驅動下,通過“算力賦能電力系統智能化轉型,電力帶動算力綠色化升級”的雙向路徑,建立算力與電力“同頻呼吸、融合共生”的發展模式,是實現智能基礎設施綠色轉型的關鍵舉措。
時間周期:
開始時間:2025年2月
截止時間:2025年12月
服務周期:服務中
應用場景
算電協同平台在全國首個5a級智算中心“商湯臨港智算中心”落地,通過構建人工智能與能源深度融合的智能基礎設施,推動臨港aidc邁向“低成本、高效能、可持續”的新階段,並為ai基礎設施綠色化升級提供可落地、可複製、可推廣的解決方案。
商湯的算電協同的實踐路徑,是在核心算法能力和商湯科技超大規模算力集群長周期高質量訓練數據的支撐下,將能源大模型技術、算力調度技術與新型儲能技術相結合,推動用戶側大規模算力應用場景與發電側新型電力系統用能模式的協同創新。
商湯通過打造「數據—算法—策略—執行—驗證」的全鏈條智能調度系統,實現算力與電力的雙向耦合,實現“電隨算動”,提高電力系統對算力負荷的響應與優化能力,最終實現算力與能源的精準匹配與高效利用。
面臨挑戰
目前算力電力雙向協同面臨資源分配、技術兼容性和成本控制等方面仍存在挑戰。如何合理分配計算資源和電力資源,以滿足不同應用場景的需求,不同硬件和軟件平台之間的兼容性問題,可能影響協同效率。此外,隨着算力和電力的協同,數據和能源的安全性問題變得更加突出,算力電力協同帶來成本的增加,需要考慮經濟效益。
電力需要在算力巨量增加的背景下動態、適時規劃穩定供給和綠色的目標,兩者之間是動態平衡的,不是電力單向適配的關係。發電預測、電力電量平衡、大範圍跨時空資源配置、長周期規模化儲能等技術提出更高要求。
因此算電協同需要進一步從資源、調度、運營到流通的全方位算電協同創新。依託園區能耗管理、儲能及工商業儲能以及虛擬電廠等技術推進綠色電力與算力聯合調度是其中重要一環。為充分發揮算力中心靈活調節特性,推動算力中心向新型電力系統主動支撐者轉變,需加強電力與算力聯合調度,使算力負荷特性與可再生能源出力特性相匹配,從而促進可再生能源消納,保障電網運行安全。具體而言,算力中心可調負荷可通過直接參与、負荷聚合商參與等形式參加不同時間尺度的電力需求響應,從中獲得價格補償。同時,算力中心可參加綠電、綠證交易,支撐自身綠色低碳轉型。
技術開發過程
商湯算電一體化協同方案以商湯臨港智算中心萬卡規模集群為落地場景。整體方案主要涵蓋三個層面:基礎設施層、能力支撐層和業務管理層,以實際算力與電力運營數據為基礎支撐,完成能源大模型與算力調度大模型的研發,通過打造算電協同管理平台,形成對算電一體化協同方案的支撐。該方案基於業務運營需求,通過對算力趨勢和用電需求的精準預測,實現對算力資源與電力資源的高效協同管理,最大化智算中心的算效與能效。
算力基礎設施
基礎設施層通過對供配電系統、溫控系統及it系統的監控等,彙集算力基礎設施的狀態數據、電力數據、算力數據和其他系統數據等底層數據。通過數據中台對這些基礎數據進行採集管理、清洗加工和標準化等數據預處理,從而更好的利用這些數據進行能源大模型的調優,並最終納入算電協同的業務管理閉環。
能源大模型體系
商湯基於自研“日日新”大模型與生態企業合作打造能源大模型體系,針對各類能源場景稠如能源調度、交易、運營等,整合算力預測模型、算力任務調度模型、異構資源調度模型、性能優化調度模型、用電負荷預測模型、氣象大模型、電力市場化交易模型等等,對算力的應用場景進行負載率和電力需求量的趨勢預測,以實現更精準的能耗管理。
商湯能源大模型體系通過深度學習、大數據分析等先進算法,能夠在tb級數據支撐下,對電力系統進行精準建模,使得大模型能夠捕捉系統中多種變量之間的複雜關聯。在保證基礎通識能力的同時,該模型體系能夠通過預測、決策、調度,處理複雜的能源任務,是能源行業內首個具備“分析、優化、決策、交互”等多種能力的全棧式大模型,可以滿足行業客戶的不同場景需求。商湯能源大模型通過邊端能量控制器感知源網荷儲資源信息,以節點“能量塊”數據結構為基本單元,通過預測下一個15分鐘的“能量塊”數據,生成自適應的“能量系統”,針對能源場景提供分析與決策能力,並通過算電協同平台進行能源調度。調度過程中支持人為評估與策略調整,調度完成後自動進行策略校驗,所有人為調整和校驗結果將被反饋至大模型,以實現模型性能的持續調優。
商湯算電一體化協同方案中,實現業務管理最終應用落地的產品形態是算電協同管理平台。該平台基於商湯能源大模型體系的能力支撐而打造,通過精細化採集能源與算力運營數據,實現智算中心數字化、可視化、智能化管理,充分掌握能源效率、算力效率、經濟效益、環境影響、系統穩定性與可調節性等關鍵數據,並支持對智算中心的算力趨勢和用電負荷精準預測及調度。
通過算電協同管理平台,實現算力賦能電力、電力保障算力的雙向促進,構建了算力與能源之間的關聯模型,僅能降低算力服務成本,提升算力運行效率,還能實現算力和電力資源的深度融合與高效協同,以支持新型基礎設施和新型電力系統的協同發展,實現聯網調度、普惠易用、綠色安全的目標。
算力管理
在算力管理方面,算電協同管理平台支持對算力總資源、實時算力、可用算力、訓練與推理任務進行監控與管理,幫助算力運營團隊實現算力趨勢預測,提供精細化、跨區域算力調度與運營和精準用能策略,提升整體算力效率與運營收益。
電力管理
在電力管理方面,基於算電協同管理平台對用電量、實時用電負荷、可調節負荷、pue等關鍵指標進行監控和預測,利用能源大模型在源、網、荷、儲側推進一體化管理監控、電力調度和效率優化,降低電力成本與系統風險。
訓推一體架構大幅提升計算利用效率
智算中心的訓練任務具有非常大的波動性,且不規律,需求時間段不穩定;而推理任務有規律,需求時間段穩定。如果按傳統的訓、推分離模式,那麼計算資源將大量閑置。為此,商湯在行業內率先引入了更加靈活的“訓推一體"調度架構,通過動態調度、離線推理、後台微調、斷點續訓、削峰填谷等算力調度優化策略,最大程度地提高算效cue稠compute utilization efficiency,計算利用效率,即單位能耗下的算力輸出能力,,極大減少資源的閑置和浪費,將單mw 電力產出的有效算力從行業均值200p大幅提升至350p。此外,在推理場景中,商湯實現了在相同算力及電力成本下的每秒請求數稠qps,4倍的大幅提升,並實現了推理服務彈性按需伸縮,優化了大規模ai推理的整體成本。
電算能源大模型實現更精準能耗管理
在pue(power usage effectiveness,電源使用效率)能效優化方面,商湯不僅通過調整暖通運行策略等方式降低能源消耗,還基於“日日新”大模型打造能源大模型體系,對算力的應用場景進行負載率和電力需求量的趨勢預測,結合設施系統配置,生成設施運行策略,通過精確用能,實現智算中心的運行優化與節能降耗。同時,商湯構建了全生命周期標準化運維管理體系,研發了運維大模型與ai智能運維管理平台。
作為算電協同的關鍵抓手,源網荷儲一體化運營通過整合電源側、電網側、負荷側資源要素,使用儲能等技術,通過高效、智能、精準的運營管理,實現電力生產和消費體系的革新。在發電側,通過合理選址,結合氣象預測,通過能源大模型實現電力市場變化趨勢的綜合預測,通過交易等形式對接清潔能源,生成組合式調度與交易策略,降低電力成本,提升清潔能源利用比例。在用戶側,進行精準用電負荷的用能管理,並提高算力負荷預測的準確性,建立了算力與電力之間的數據穿透,加強電力與算力聯合調度,使算力負荷特性與可再生能源出力特性相匹配,促進可再生能源消納,保障電網運行安全。

自研能源大模型聯合智慧運維,全年節電300萬度。商湯大裝置基於海量行業知識文本、能源結構化數據、算力監控指標等數據訓練,並結合能源行業知識庫形成lm+agent 能源大模型體系,顯著提高模型專業性與領域適用性。通過能源大模型結合現場智慧運維開展各項節能工作,年度pue優化至1.28以內,實現全年節約用電300萬度。
創新“能量塊”算法架構,讓複雜場景預測更精準。通過將能源本徵數據、用戶用能特性、能源平衡規則等信息與算力服務器綁定為“能量塊”作為基礎token,並基於多輪預訓練結果優化調整算法架構,可全面提升複雜場景下的預測精度與泛化能力。
採用15分鐘高頻次動態調度,實現最優能源平衡。平台以15分鐘為周期進行高頻次預測,並以5分鐘為周期進行決策修正迭代,基於實時能源狀態與負載預測,自動生成最優調度策略,並通過跨系統聯動執行,實現精準的算力預測、負荷預測、策略生成與修正。
目前,基於能量塊的模型能源需求預測準確率已經達到88%以上,決策準確率已達到93%以上,預計在年內隨着算法與儲能設備的持續迭代優化,預測準確率將達到90%-95%的行業領先水平,決策準確率95%+。
應用效果/社會價值
隨着人工智能應用爆髮式增長,算力需求迅猛增加,已成為推動產業綠色化轉型發展新的關鍵生產力。隨着智算中心的高功耗和高散熱要求,其運營成本不斷上升,推動智算中心的綠色發展變得迫切。算力與電力的強耦合關係,決定了電力能耗成為制約算力設施建設、推動產業數智化轉型的關鍵因素。算電協同指依託計算能力和電力供應之間的協同發展,旨在優化計算資源的能源效率和可持續性。
根據idc數據,國家計算力指數與gdp/數字經濟的走勢呈現出了顯著的正相關,十五個重點國家的計算力指數平均每提高1點,國家的數字經濟和gdp將分別增長3.5‰和1.8‰。此外,算力供給創造巨大的經濟價值,將釋放數字經濟發展潛能,推動數字經濟產業布局優化、提升產業效率;促進區域數據流通、價值傳遞;延展區域發展空間,推進區域協同形成新格局。
關於企業
·商湯科技
作為人工智能軟件公司,商湯科技以“堅持原創,讓ai引領人類進步”為使命,旨在持續引領人工智能前沿研究,持續打造更具拓展性更普惠的人工智能軟件平台,推動經濟、社會和人類的發展。
商湯科技擁有深厚的學術積累,並長期投入於原創技術研究,不斷增強行業領先的多模態、多任務通用人工智能能力,涵蓋感知智能、自然語言處理、決策智能、智能內容生成等關鍵技術領域,同時包含ai芯片、ai傳感器及ai算力基礎設施在內的關鍵能力。