顶端新闻记者 聂辉 北京报道
3月24日,国新办举行新闻发布会,介绍第九届数字中国建设峰会有关情况。国家发展改革委党组成员、国家数据局局长刘烈宏介绍,全国已建成的高质量数据集超过了10万个,总体量超过了890PB,相当于中国国家图书馆数字资源总量的310倍左右。
国家发展改革委党组成员、国家数据局局长刘烈宏(徐想 摄)
刘烈宏介绍,为推动数据标注产业发展,国家数据局布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。
国家数据局还持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。刘烈宏表示,支持数据流通服务平台、数据商等机构提供数据流通交易的服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,推动高质量数据集供需有序对接,支持行业高质量数据集流动起来。
刘烈宏介绍,在各方共同努力下,高质量数据集的建设工作取得了阶段性的成效,截至2025年年底,全国已建成的高质量数据集超过了10万个,总体量超过了890PB,这相当于中国国家图书馆数字资源总量的310倍左右。
顶端新闻记者从发布会上了解到,截至今年3月,我国日均Token的调用量,也就是词元的调用量,已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
刘烈宏表示,日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化。从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强。现在大家热议的Token出海,就是产业竞争力增强的一个标志,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
来源:顶端新闻