DeepSeek助力算力与算法平权,AI界聚焦高质量数据集 数博会
“DeepSeek的开源推动了算力和算法的平权,但数据平权仍面临挑战。”北京交通大学信息管理理论与技术国际研究中心(ICIR)特聘教授张向宏在接受《中国经营报》记者采访时指出,高质量数据集的构建已成为全社会关注的焦点。
记者了解到,国家发改委和国家数据局已出台一系列文件,推动高质量数据集建设。与此同时,不少企业也在转型,专注于面向人工智能的高质量数据集加工。
在2024年第十届数博会上,张向宏团队发布了我国首张数据产业图谱。今年的2025年数博会上,他带来了新的研究成果。
“数据企业增长速度非常快。我们去年发布的数据显示,全国数据产业相关企业数量为19.7万家,今年已超过40万家。”张向宏介绍,“此外,数据产业规模也在迅速扩大:去年规模超过2.9万亿元,今年已达到5.86万亿元,呈现出巨大的增长。”
张向宏向记者表示:“国家推动数据要素化、价值化,近两年取得了显著成就。但在数据的大规模流通和安全保障方面,也出现了一些新问题。”
数据的大规模流通与安全保障是全球性难题。中国率先发布了《国家数据基础设施建设指引》,提出数场、可信数据空间、数联网、隐私保护计算、区块链和数据元件六条技术路线,并在全国18个地方启动试点,25个地方开展互联互通。
张向宏介绍,今年第二批试点示范即将启动,涉及42个地方。加上去年的18个试点,全国共有60多个地方和行业将同步展开探索。通过三年建设,预计到2028年年底,将形成一个横向联通、纵向贯通、协调有力的全国数据基础设施体系。
随着DeepSeek在算力与算法上的突破,实现了“算力平权”和“算法平权”,数据平权逐渐成为下一阶段的关键议题。
目前deepseek,国内高质量数据集建设仍存在两大问题:首先,生产方式仍处于作坊化阶段。专业厂商规模较小、水平不高,自动化与智能化程度不足。其次,社会对数据价值认知不足,政府、企业和个人缺乏购买高质量数据的习惯。
为破解这些难题,一些地方已开始政策探索。例如,深圳市率先推出“语料券”,支持高质量数据集的供给、需求与交易;上海市也出台了类似政策;在北京市,大数据交易所的语料交易已占其数据交易总量的80%以上。原文出处:DeepSeek助力算力与算法平权,AI界聚焦高质量数据集 数博会,感谢原作者,侵权必删!