随着人工智能应用生态的演进,大模型正加速从传统的聊天式交互向更加复杂的Agent应用转变。相较于以往,Agent应用往往需要处理更长的上下文信息、执行更频繁的调用、进行更复杂的任务编排,并与外部工具、系统及数据源保持持续的协同。
这意味着,未来算力消耗的增长核心将不再局限于更大参数模型的训练,而是更多地来源于推理调用频次的激增、推理链路的拉长以及在线服务规模的不断扩大。换言之,决定大模型能否真正广泛赋能千行百业的关键所在,正逐渐从“能否训练出更大的模型”转向“能否以可承受的成本,稳定提供大规模的推理服务”。
国家数据局局长刘烈宏24日在国新办举行的新闻发布会上表示,到今年3月,我国日均词元(Token)调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
“日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。”刘烈宏表示,人工智能应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力在显著增强,现在备受关注的Token出海,就是产业竞争力增强的一个标志。
据刘烈宏介绍,在各方共同努力下,我国高质量数据集的建设工作取得了阶段性成效,截止到2025年底,全国已建成的高质量数据集超过10万个,总体量超过890PB,这相当于中国国家图书馆数字资源总量的310倍左右。
下一步,国家数据局将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质提升。