激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元

2025年05月18日09:10:17 科技 6323
 
 
 

17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将达到7.5万亿元。

公共数据开放共享

激活海量“沉睡数据”

 
 

作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年我国年度数据生产总量达41.06泽字节,同比增长25%。

  • 截至目前,我国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

国家数据局局长 刘烈宏:当前我们正谋划构建横向联通、纵向贯通、协调有力的数据基础设施体系,到2029年要基本建成国家数据基础设施主体结构。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

公共数据开放共享成为数据要素市场化的重要突破口。2024年全国地市级以上的地方公共数据开放平台数量增长7.5%,开放数据量增长7.1%,高质量数据集数量同比增长27.4%。

在数据要素与产业融合方面,国家正加快打通公共数据共享开放壁垒,推动公共数据与企业数据深度融合,激活海量“沉睡数据”。

构建高质量数据集

加速人工智能发展

 
 

眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基石,更重塑了从技术研发到商业落地的全产业链条。那高质量数据集是如何构建的?

在浙江温州,作为全国数据要素市场化改革的“试验田”,这里构建了一套数据安全与合规体系,保障数据要素规模化流动,形成数据交易生态圈,让更多数据“活了起来”。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

浙江省温州市数据局副局长 金传拉:打造了469款“实用、好用、安全”的数据产品,在医疗、交通、低空经济等领域建设了一批高质量数据集。

技术人员告诉记者,构建大模型数据集主要包含数据采集、数据清洗、数据标注、质量评估等核心环节。各环节需要根据大模型数据集的规模大、多样性足、行业垂直属性强等特点进行针对性技术研发和适配。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

北京大学计算机学院教授 黄铁军:文本类的数据,文献、图书、论文、研究报告,这些数据大部分已经用了。未来还是需要更多非文本的,比如说图像、视频、各种传感器的,这些数据也是大模型学习的重要来源。

数据标注与清洗是高质量数据集建设的关键环节。

  • 数据标注通过“贴标签”,教会人工智能“认知世界”,未经标注的数据如同乱码教材,导致人工智能无法有效学习;
  • 数据清洗则通过剔除重复、修正错误等操作净化数据,混乱数据将直接影响人工智能训练效果。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副总工程师 刘权:当数据覆盖足够广泛的场景并经过专业标注时,ai模型才能突破“实验室精度”,真正具备产业落地的能力,带动数字经济发展。

我国数据标注产业产值超80亿元

 
 

在2025数据安全发展大会发布的《2025高质量数据集研究报告》显示,随着人工智能、大模型技术迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展新阶段。

2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%,有力支撑人工智能训练和应用。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副院长 刘文强:我们大模型的参数已经达到了几千亿级别。推进全国七个数据标注基地建设,构建医疗、工业、教育等领域的335个高质量数据集,标注总规模达到1.7万亿tb,支撑了121个国产大模型的研发。

报告显示,当前我国正加速推动高质量数据集创新发展,但是仍然面临数据存量小产量低、数据集质量良莠不齐、缺乏主流高价值数据引领、数据利用效率低等问题。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副总工程师 刘权:做好数据源头管控,确保数据来源的可靠性、完整性。加强数据隐私与安全保障,推动数据集安全评估能力建设。

(总台央视记者 王世玉 张伟 唐志坚 张延 韩栋)

科技分类资讯推荐

从聊天机器人到协作伙伴:AI智能体如何重塑企业工作 - 天天要闻

从聊天机器人到协作伙伴:AI智能体如何重塑企业工作

Scott White至今仍对人工智能从新奇技术转变为真正工作伙伴的速度感到惊叹。仅仅一年多前,这位Anthropic公司Claude AI产品负责人目睹了早期AI编程工具甚至无法完成一行代码的窘境。如今,尽管并非专业程序员,他却能亲自构建
小米 16 系列迎最新爆料,Pro 系列镜头模组大改,横向延伸全尺寸设计 - 天天要闻

小米 16 系列迎最新爆料,Pro 系列镜头模组大改,横向延伸全尺寸设计

近日,包括数码闲聊站在内等多个消息源,就下一代旗舰新机纷纷进行了最新爆料,其中小米 16 系列也在近日迎来了最新消息。根据最新爆料来看,小米 16 系列将会在以往的标准版、Pro 版、Ultra 的基础上新增一款 Pro Max 型号。但一一对应来看,新款的小米 16 Pro 即对标标准版 , 为大家熟悉的 6.3 英寸小尺寸旗舰机型。而 1...
魅族 22 系列手机本月到来,提供全新开模小尺寸旗舰版本 - 天天要闻

魅族 22 系列手机本月到来,提供全新开模小尺寸旗舰版本

伴随着时间来到 7 月,各大手机厂商的新机更新计划有所放缓,不过根据多方爆料来看,“小厂代表” 星纪魅族旗下的魅族 22 系列将会在本月与大家见面。目前魅族 22 系列仍然十分 “神秘”,欠缺主要的配置爆料与外观图片作为参考。但根据部分什么爆料者的消息来看,魅族 22 系列将会全新开模,并提供小尺寸旗舰版本可供选择...
vivo X300 Pro 更多细节曝光,大 R 角直面屏,新款大底主摄方案加持 - 天天要闻

vivo X300 Pro 更多细节曝光,大 R 角直面屏,新款大底主摄方案加持

今天数码博主数码闲聊站在与网友互动中,透露了一款搭载联发科天玑 9500 的 “大杯” 工程机的最新进展。参考爆料内容与评论区互动来看,预计为 vivo X300 Pro。除搭载联发科天玑 9500 外,据悉该机一大变化之处在于屏幕部分,根据最新消息来看将会搭载一块大 R 角直屏,不再采用曲面屏或微曲面屏设计。而这也将成为下一代...
数据驱动,柔性智能建造平台助力高效管理 - 天天要闻

数据驱动,柔性智能建造平台助力高效管理

长沙晚报掌上长沙7月1日讯(全媒体记者 刘嘉)6月30日,由长沙市智能建造产业链推进办公室与中建五局三公司联合承办的“创新驱动 智建未来”科技活动举行。该活动不仅展示了长沙在智能建造领域的创新成果,也为行业高质量发展提供了可复制的实践经验。
以前不敢想,机械革命搭配出4959元的RTX5050本,还有2.5K屏 - 天天要闻

以前不敢想,机械革命搭配出4959元的RTX5050本,还有2.5K屏

最近RTX5050本开始大面积登场,很多消费者也想知道,厂商到底能搭配出什么样配置?结果机械革命没有让大家失望,搭配出一个6199元的新品,补贴后价格4959元,再一次刷新新显卡笔记本的价格新低。同时,其配置还不是很潦草,还是很平衡的,让我们来看看。这款本配置了R9 7845HX处理器,12核心,24线程,台积电5nm工艺,Zen4...
中国移动三大核心布局 助力南亚东南亚数字经济新发展 - 天天要闻

中国移动三大核心布局 助力南亚东南亚数字经济新发展

【来源:云南网】6月30日,由云南省人民政府和云南省工业和信息化厅联合举办的面向南亚东南亚数字合作推介会在北京举行,中国移动副总经理陈怀达出席,中国移动数智化部副总经理陶涛发表主题为《建设跨境数据交易高速公路,服务数字信息大通道建设》的演讲