激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元

2025年05月18日09:10:17 科技 6323
 
 
 

17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将达到7.5万亿元。

公共数据开放共享

激活海量“沉睡数据”

 
 

作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年我国年度数据生产总量达41.06泽字节,同比增长25%。

  • 截至目前,我国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

国家数据局局长 刘烈宏:当前我们正谋划构建横向联通、纵向贯通、协调有力的数据基础设施体系,到2029年要基本建成国家数据基础设施主体结构。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

公共数据开放共享成为数据要素市场化的重要突破口。2024年全国地市级以上的地方公共数据开放平台数量增长7.5%,开放数据量增长7.1%,高质量数据集数量同比增长27.4%。

在数据要素与产业融合方面,国家正加快打通公共数据共享开放壁垒,推动公共数据与企业数据深度融合,激活海量“沉睡数据”。

构建高质量数据集

加速人工智能发展

 
 

眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基石,更重塑了从技术研发到商业落地的全产业链条。那高质量数据集是如何构建的?

在浙江温州,作为全国数据要素市场化改革的“试验田”,这里构建了一套数据安全与合规体系,保障数据要素规模化流动,形成数据交易生态圈,让更多数据“活了起来”。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

浙江省温州市数据局副局长 金传拉:打造了469款“实用、好用、安全”的数据产品,在医疗、交通、低空经济等领域建设了一批高质量数据集。

技术人员告诉记者,构建大模型数据集主要包含数据采集、数据清洗、数据标注、质量评估等核心环节。各环节需要根据大模型数据集的规模大、多样性足、行业垂直属性强等特点进行针对性技术研发和适配。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

北京大学计算机学院教授 黄铁军:文本类的数据,文献、图书、论文、研究报告,这些数据大部分已经用了。未来还是需要更多非文本的,比如说图像、视频、各种传感器的,这些数据也是大模型学习的重要来源。

数据标注与清洗是高质量数据集建设的关键环节。

  • 数据标注通过“贴标签”,教会人工智能“认知世界”,未经标注的数据如同乱码教材,导致人工智能无法有效学习;
  • 数据清洗则通过剔除重复、修正错误等操作净化数据,混乱数据将直接影响人工智能训练效果。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副总工程师 刘权:当数据覆盖足够广泛的场景并经过专业标注时,ai模型才能突破“实验室精度”,真正具备产业落地的能力,带动数字经济发展。

我国数据标注产业产值超80亿元

 
 

在2025数据安全发展大会发布的《2025高质量数据集研究报告》显示,随着人工智能、大模型技术迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展新阶段。

2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%,有力支撑人工智能训练和应用。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副院长 刘文强:我们大模型的参数已经达到了几千亿级别。推进全国七个数据标注基地建设,构建医疗、工业、教育等领域的335个高质量数据集,标注总规模达到1.7万亿tb,支撑了121个国产大模型的研发。

报告显示,当前我国正加速推动高质量数据集创新发展,但是仍然面临数据存量小产量低、数据集质量良莠不齐、缺乏主流高价值数据引领、数据利用效率低等问题。

激活海量“沉睡数据” 2030年我国数据产业规模将达7.5万亿元 - 天天要闻

赛迪研究院副总工程师 刘权:做好数据源头管控,确保数据来源的可靠性、完整性。加强数据隐私与安全保障,推动数据集安全评估能力建设。

(总台央视记者 王世玉 张伟 唐志坚 张延 韩栋)

科技分类资讯推荐

张朝阳、傅盛等人激辩中美AI竞争,张亚勤:未来5年中国最大优势是人才 - 天天要闻

张朝阳、傅盛等人激辩中美AI竞争,张亚勤:未来5年中国最大优势是人才

本文来源:时代周报 作者:何珊珊自2023年人工智能浪潮爆发以来,AI领域从技术突破到应用落地一直备受热议。如今人工智能的浪潮并未消散,反而越演愈烈,全球进入人工智能重塑竞争格局的关键节点。5月17日,在搜狐科技年度论坛上,搜狐创始人张朝阳、清华大学智能产业研究院院长张亚勤、猎豹移动董事长傅盛、清华大学人工智...
最高增长27倍!直播平台红人首战天猫618爆发强劲 - 天天要闻

最高增长27倍!直播平台红人首战天猫618爆发强劲

天猫618开卖首小时,多位新入淘的抖音服饰红人爆发强劲,最高环比日销增长了27倍。不少从小红书、视频号来的服饰商家,也实现了最高近10倍的井喷式增长。他们大多是在多平台运营的直播商家,没想到货架的爆发力这么强,开卖首日淘宝平台成交明显优于其
事关中国芯片,黄仁勋最新表态 - 天天要闻

事关中国芯片,黄仁勋最新表态

据参考消息援引新加坡《联合早报》网站5月17日报道,英伟达首席执行官黄仁勋表示,由于美国政府限制Hopper架构的H20芯片出口至中国,公司正重新审视中国市场战略,但未来不会再推出Hopper系列芯片。黄仁勋(资料图)据报道,黄仁勋17日受访时说,针对中国市场,英伟达在H20芯片后不会再推出Hopper系列产品。他说:“不会是...
网友求助:通过华为面试,签约告知是慧通,要不要去?| 揭秘华为5类用工体系 - 天天要闻

网友求助:通过华为面试,签约告知是慧通,要不要去?| 揭秘华为5类用工体系

作者 | 深莞华友圈、冰川松鼠 来源 | 蓝血研究(lanxueyanjiu)投稿 | lanxueziben(微信)城市合伙人招募 | lanxueziben(微信)蓝血私塾 点击进入>知乎上有人留言,如下:有网友神回复如下:‘面试:他:亲,您签订的这个公司是华为智选公司。你:那请问是华为公司吗?他:华为智选公司是华为公司的,走的待遇晋升都与华...
网速比现在快10倍!它,来了 - 天天要闻

网速比现在快10倍!它,来了

最近,万兆宽带网络开始在全国多地试运行,有的居民家中已经安上了。到底怎么才能用上这么快的网速呢?家里网速如何快到一万兆?在北京丰台的一个小区,不久前,这里刚被列为万兆小区试点。工程师表示,给家里安装万兆光网除了要用到特殊的路由器和网线之外,步骤和安装普通宽带差不多,会根据户型等情况设计具体的安装方案...
手机上就能申请补贴!转发给这些需要的人 - 天天要闻

手机上就能申请补贴!转发给这些需要的人

5 月 18 日是第三十五个全国助残日,今年的主题是“弘扬自强与助残精神,凝聚团结奋进力量”。“不方便走动,怎么办理残疾人证?”“残疾人可以申请哪些补贴,如何申请?”“关于助残的相关问题,何处查询?”来国务院客户端小程序【助残服务专区】,证件办理和补贴申请,可在全国范围内实现“跨省通办”,不必出门,手机办...