激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元

2025年05月18日09:10:17 科技 6323
 
 
 

17日,記者從2025數據安全發展大會上獲悉,我國將培育壯大一批數據要素產業鏈上下游企業,預計到2030年,我國數據產業規模將達到7.5萬億元。

公共數據開放共享

激活海量「沉睡數據」

 
 

作為全球首個將數據納入生產要素的國家,我國已初步構建起門類齊全的數據產業鏈。數據顯示,2024年我國年度數據生產總量達41.06澤位元組,同比增長25%。

  • 截至目前,我國數據領域相關企業超19萬家,數據產業規模超2萬億元。按照20%以上的年均增長率測算,2030年我國數據產業規模將達7.5萬億元。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

國家數據局局長 劉烈宏:當前我們正謀劃構建橫向聯通、縱向貫通、協調有力的數據基礎設施體系,到2029年要基本建成國家數據基礎設施主體結構。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

公共數據開放共享成為數據要素市場化的重要突破口。2024年全國地市級以上的地方公共數據開放平台數量增長7.5%,開放數據量增長7.1%,高質量數據集數量同比增長27.4%。

在數據要素與產業融合方面,國家正加快打通公共數據共享開放壁壘,推動公共數據與企業數據深度融合,激活海量「沉睡數據」。

構建高質量數據集

加速人工智慧發展

 
 

眼下,數據已超越傳統生產要素,成為驅動人工智慧技術突破與產業變革的核心動力。高質量數據集不僅是人工智慧模型性能躍升的基石,更重塑了從技術研發到商業落地的全產業鏈條。那高質量數據集是如何構建的?

在浙江溫州,作為全國數據要素市場化改革的「試驗田」,這裡構建了一套數據安全與合規體系,保障數據要素規模化流動,形成數據交易生態圈,讓更多數據「活了起來」。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

浙江省溫州市數據局副局長 金傳拉:打造了469款「實用、好用、安全」的數據產品,在醫療、交通、低空經濟等領域建設了一批高質量數據集。

技術人員告訴記者,構建大模型數據集主要包含數據採集、數據清洗、數據標註、質量評估等核心環節。各環節需要根據大模型數據集的規模大、多樣性足、行業垂直屬性強等特點進行針對性技術研發和適配。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

北京大學計算機學院教授 黃鐵軍:文本類的數據,文獻、圖書、論文、研究報告,這些數據大部分已經用了。未來還是需要更多非文本的,比如說圖像、視頻、各種感測器的,這些數據也是大模型學習的重要來源。

數據標註與清洗是高質量數據集建設的關鍵環節。

  • 數據標註通過「貼標籤」,教會人工智慧「認知世界」,未經標註的數據如同亂碼教材,導致人工智慧無法有效學習;
  • 數據清洗則通過剔除重複、修正錯誤等操作凈化數據,混亂數據將直接影響人工智慧訓練效果。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副總工程師 劉權:當數據覆蓋足夠廣泛的場景並經過專業標註時,ai模型才能突破「實驗室精度」,真正具備產業落地的能力,帶動數字經濟發展。

我國數據標註產業產值超80億元

 
 

在2025數據安全發展大會發布的《2025高質量數據集研究報告》顯示,隨著人工智慧、大模型技術迭代,我國數據標註產業產值已突破80億元,高質量數據建設進入規模化、規範化發展新階段。

2024年,我國開發或應用人工智慧的企業數量同比增長36%,高質量數據集數量同比增長27.4%,有力支撐人工智慧訓練和應用。利用大模型的數據技術企業和數據應用企業同比分別增長57.21%、37.14%。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副院長 劉文強:我們大模型的參數已經達到了幾千億級別。推進全國七個數據標註基地建設,構建醫療、工業、教育等領域的335個高質量數據集,標註總規模達到1.7萬億tb,支撐了121個國產大模型的研發。

報告顯示,當前我國正加速推動高質量數據集創新發展,但是仍然面臨數據存量小產量低、數據集質量良莠不齊、缺乏主流高價值數據引領、數據利用效率低等問題。

激活海量「沉睡數據」 2030年我國數據產業規模將達7.5萬億元 - 天天要聞

賽迪研究院副總工程師 劉權:做好數據源頭管控,確保數據來源的可靠性、完整性。加強數據隱私與安全保障,推動數據集安全評估能力建設。

(總台央視記者 王世玉 張偉 唐志堅 張延 韓棟)

科技分類資訊推薦

張朝陽、傅盛等人激辯中美AI競爭,張亞勤:未來5年中國最大優勢是人才 - 天天要聞

張朝陽、傅盛等人激辯中美AI競爭,張亞勤:未來5年中國最大優勢是人才

本文來源:時代周報 作者:何珊珊自2023年人工智慧浪潮爆發以來,AI領域從技術突破到應用落地一直備受熱議。如今人工智慧的浪潮並未消散,反而越演愈烈,全球進入人工智慧重塑競爭格局的關鍵節點。5月17日,在搜狐科技年度論壇上,搜狐創始人張朝陽、清華大學智能產業研究院院長張亞勤、獵豹移動董事長傅盛、清華大學人工智...
最高增長27倍!直播平台紅人首戰天貓618爆發強勁 - 天天要聞

最高增長27倍!直播平台紅人首戰天貓618爆發強勁

天貓618開賣首小時,多位新入淘的抖音服飾紅人爆發強勁,最高環比日銷增長了27倍。不少從小紅書、視頻號來的服飾商家,也實現了最高近10倍的井噴式增長。他們大多是在多平台運營的直播商家,沒想到貨架的爆發力這麼強,開賣首日淘寶平台成交明顯優於其
事關中國晶元,黃仁勛最新表態 - 天天要聞

事關中國晶元,黃仁勛最新表態

據參考消息援引新加坡《聯合早報》網站5月17日報道,英偉達首席執行官黃仁勛表示,由於美國政府限制Hopper架構的H20晶元出口至中國,公司正重新審視中國市場戰略,但未來不會再推出Hopper系列晶元。黃仁勛(資料圖)據報道,黃仁勛17日受訪時說,針對中國市場,英偉達在H20晶元後不會再推出Hopper系列產品。他說:「不會是...
網友求助:通過華為面試,簽約告知是慧通,要不要去?| 揭秘華為5類用工體系 - 天天要聞

網友求助:通過華為面試,簽約告知是慧通,要不要去?| 揭秘華為5類用工體系

作者 | 深莞華友圈、冰川松鼠 來源 | 藍血研究(lanxueyanjiu)投稿 | lanxueziben(微信)城市合伙人招募 | lanxueziben(微信)藍血私塾 點擊進入>知乎上有人留言,如下:有網友神回復如下:『面試:他:親,您簽訂的這個公司是華為智選公司。你:那請問是華為公司嗎?他:華為智選公司是華為公司的,走的待遇晉陞都與華...
網速比現在快10倍!它,來了 - 天天要聞

網速比現在快10倍!它,來了

最近,萬兆寬頻網路開始在全國多地試運行,有的居民家中已經安上了。到底怎麼才能用上這麼快的網速呢?家裡網速如何快到一萬兆?在北京丰台的一個小區,不久前,這裡剛被列為萬兆小區試點。工程師表示,給家裡安裝萬兆光網除了要用到特殊的路由器和網線之外,步驟和安裝普通寬頻差不多,會根據戶型等情況設計具體的安裝方案...
手機上就能申請補貼!轉發給這些需要的人 - 天天要聞

手機上就能申請補貼!轉發給這些需要的人

5 月 18 日是第三十五個全國助殘日,今年的主題是「弘揚自強與助殘精神,凝聚團結奮進力量」。「不方便走動,怎麼辦理殘疾人證?」「殘疾人可以申請哪些補貼,如何申請?」「關於助殘的相關問題,何處查詢?」來國務院客戶端小程序【助殘服務專區】,證件辦理和補貼申請,可在全國範圍內實現「跨省通辦」,不必出門,手機辦...