激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元

2025年05月18日09:10:17 科技 6323
 
 
 

17日,記者從2025數據安全發展大會上獲悉,我國將培育壯大一批數據要素產業鏈上下游企業,預計到2030年,我國數據產業規模將達到7.5萬億元。

公共數據開放共享

激活海量「沉睡數據」

 
 

作為全球首個將數據納入生產要素的國家,我國已初步構建起門類齊全的數據產業鏈。數據顯示,2024年我國年度數據生產總量達41.06澤位元組,同比增長25%。

  • 截至目前,我國數據領域相關企業超19萬家,數據產業規模超2萬億元。按照20%以上的年均增長率測算,2030年我國數據產業規模將達7.5萬億元。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

國家數據局局長 劉烈宏:當前我們正謀劃構建橫向聯通、縱向貫通、協調有力的數據基礎設施體系,到2029年要基本建成國家數據基礎設施主體結構。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

公共數據開放共享成為數據要素市場化的重要突破口。2024年全國地市級以上的地方公共數據開放平台數量增長7.5%,開放數據量增長7.1%,高質量數據集數量同比增長27.4%。

在數據要素與產業融合方面,國家正加快打通公共數據共享開放壁壘,推動公共數據與企業數據深度融合,激活海量「沉睡數據」。

構建高質量數據集

加速人工智能發展

 
 

眼下,數據已超越傳統生產要素,成為驅動人工智能技術突破與產業變革的核心動力。高質量數據集不僅是人工智能模型性能躍升的基石,更重塑了從技術研發到商業落地的全產業鏈條。那高質量數據集是如何構建的?

在浙江溫州,作為全國數據要素市場化改革的「試驗田」,這裡構建了一套數據安全與合規體系,保障數據要素規模化流動,形成數據交易生態圈,讓更多數據「活了起來」。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

浙江省溫州市數據局副局長 金傳拉:打造了469款「實用、好用、安全」的數據產品,在醫療、交通、低空經濟等領域建設了一批高質量數據集。

技術人員告訴記者,構建大模型數據集主要包含數據採集、數據清洗、數據標註、質量評估等核心環節。各環節需要根據大模型數據集的規模大、多樣性足、行業垂直屬性強等特點進行針對性技術研發和適配。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

北京大學計算機學院教授 黃鐵軍:文本類的數據,文獻、圖書、論文、研究報告,這些數據大部分已經用了。未來還是需要更多非文本的,比如說圖像、視頻、各種傳感器的,這些數據也是大模型學習的重要來源。

數據標註與清洗是高質量數據集建設的關鍵環節。

  • 數據標註通過「貼標籤」,教會人工智能「認知世界」,未經標註的數據如同亂碼教材,導致人工智能無法有效學習;
  • 數據清洗則通過剔除重複、修正錯誤等操作凈化數據,混亂數據將直接影響人工智能訓練效果。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副總工程師 劉權:當數據覆蓋足夠廣泛的場景並經過專業標註時,ai模型才能突破「實驗室精度」,真正具備產業落地的能力,帶動數字經濟發展。

我國數據標註產業產值超80億元

 
 

在2025數據安全發展大會發佈的《2025高質量數據集研究報告》顯示,隨着人工智能、大模型技術迭代,我國數據標註產業產值已突破80億元,高質量數據建設進入規模化、規範化發展新階段。

2024年,我國開發或應用人工智能的企業數量同比增長36%,高質量數據集數量同比增長27.4%,有力支撐人工智能訓練和應用。利用大模型的數據技術企業和數據應用企業同比分別增長57.21%、37.14%。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副院長 劉文強:我們大模型的參數已經達到了幾千億級別。推進全國七個數據標註基地建設,構建醫療、工業、教育等領域的335個高質量數據集,標註總規模達到1.7萬億tb,支撐了121個國產大模型的研發。

報告顯示,當前我國正加速推動高質量數據集創新發展,但是仍然面臨數據存量小產量低、數據集質量良莠不齊、缺乏主流高價值數據引領、數據利用效率低等問題。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副總工程師 劉權:做好數據源頭管控,確保數據來源的可靠性、完整性。加強數據隱私與安全保障,推動數據集安全評估能力建設。

(總台央視記者 王世玉 張偉 唐志堅 張延 韓棟)

科技分類資訊推薦

從聊天機械人到協作夥伴:AI智能體如何重塑企業工作 - 天天要聞

從聊天機械人到協作夥伴:AI智能體如何重塑企業工作

Scott White至今仍對人工智能從新奇技術轉變為真正工作夥伴的速度感到驚嘆。僅僅一年多前,這位Anthropic公司Claude AI產品負責人目睹了早期AI編程工具甚至無法完成一行代碼的窘境。如今,儘管並非專業程序員,他卻能親自構建
小米 16 系列迎最新爆料,Pro 系列鏡頭模組大改,橫向延伸全尺寸設計 - 天天要聞

小米 16 系列迎最新爆料,Pro 系列鏡頭模組大改,橫向延伸全尺寸設計

近日,包括數碼閑聊站在內等多個消息源,就下一代旗艦新機紛紛進行了最新爆料,其中小米 16 系列也在近日迎來了最新消息。根據最新爆料來看,小米 16 系列將會在以往的標準版、Pro 版、Ultra 的基礎上新增一款 Pro Max 型號。但一一對應來看,新款的小米 16 Pro 即對標標準版 , 為大家熟悉的 6.3 英寸小尺寸旗艦機型。而 1...
魅族 22 系列手機本月到來,提供全新開模小尺寸旗艦版本 - 天天要聞

魅族 22 系列手機本月到來,提供全新開模小尺寸旗艦版本

伴隨着時間來到 7 月,各大手機廠商的新機更新計劃有所放緩,不過根據多方爆料來看,「小廠代表」 星紀魅族旗下的魅族 22 系列將會在本月與大家見面。目前魅族 22 系列仍然十分 「神秘」,欠缺主要的配置爆料與外觀圖片作為參考。但根據部分什麼爆料者的消息來看,魅族 22 系列將會全新開模,並提供小尺寸旗艦版本可供選擇...
vivo X300 Pro 更多細節曝光,大 R 角直面屏,新款大底主攝方案加持 - 天天要聞

vivo X300 Pro 更多細節曝光,大 R 角直面屏,新款大底主攝方案加持

今天數碼博主數碼閑聊站在與網友互動中,透露了一款搭載聯發科天璣 9500 的 「大杯」 工程機的最新進展。參考爆料內容與評論區互動來看,預計為 vivo X300 Pro。除搭載聯發科天璣 9500 外,據悉該機一大變化之處在於屏幕部分,根據最新消息來看將會搭載一塊大 R 角直屏,不再採用曲面屏或微曲面屏設計。而這也將成為下一代...
數據驅動,柔性智能建造平台助力高效管理 - 天天要聞

數據驅動,柔性智能建造平台助力高效管理

長沙晚報掌上長沙7月1日訊(全媒體記者 劉嘉)6月30日,由長沙市智能建造產業鏈推進辦公室與中建五局三公司聯合承辦的「創新驅動 智建未來」科技活動舉行。該活動不僅展示了長沙在智能建造領域的創新成果,也為行業高質量發展提供了可複製的實踐經驗。
以前不敢想,機械革命搭配出4959元的RTX5050本,還有2.5K屏 - 天天要聞

以前不敢想,機械革命搭配出4959元的RTX5050本,還有2.5K屏

最近RTX5050本開始大面積登場,很多消費者也想知道,廠商到底能搭配出什麼樣配置?結果機械革命沒有讓大家失望,搭配出一個6199元的新品,補貼後價格4959元,再一次刷新新顯卡筆記本的價格新低。同時,其配置還不是很潦草,還是很平衡的,讓我們來看看。這款本配置了R9 7845HX處理器,12核心,24線程,台積電5nm工藝,Zen4...
中國移動三大核心布局 助力南亞東南亞數字經濟新發展 - 天天要聞

中國移動三大核心布局 助力南亞東南亞數字經濟新發展

【來源:雲南網】6月30日,由雲南省人民政府和雲南省工業和信息化廳聯合舉辦的面向南亞東南亞數字合作推介會在北京舉行,中國移動副總經理陳懷達出席,中國移動數智化部副總經理陶濤發表主題為《建設跨境數據交易高速公路,服務數字信息大通道建設》的演講