刚刚，国家数据局发文：2028年前建成AI核心“粮仓”，Token或成新计价单位

文章来源：企鹅号 - 华东数交

过去半年，大家都在聊大模型有多聪明。但很多人不知道，AI变聪明的关键，其实不在于算法，而在于“吃”进去的数据质量。

6月8日，国家数据局正式印发了一份重磅文件——《关于推进行业高质量数据集建设行动的实施方案》。这是国家层面第一次系统性地给AI的“食物”（数据）立规矩、建工厂。

为什么要搞这个？

简单来说，现在的AI就像一辆超跑，但如果喂给它的是“地沟油”（低质量、杂乱的数据），车再好也跑不快，甚至会跑偏。这份文件的核心目的，就是要在2028年底前，建成一批高质量、经过验证的行业数据集，让AI真正懂行（比如懂医疗、懂工业、懂金融），而不只是会聊天。

这对我们意味着什么？

文件里透露了几个非常关键的信号，值得所有人关注：

1、“数据标注”要升级了

以前靠人力拉框的苦力活儿，以后要变成“人机协同”。国家将重点扶持一批数据标注基地，这意味着相关产业和就业会有新机会。

2、具身智能（机器人）是大头

文件特别点名要搞“具身智能”（也就是人形机器人、自动驾驶）的数据集。要让机器人动起来、不摔跤，需要大量的真机交互数据。这是未来的兵家必争之地。

3、数据可以“Token交易”

这可能是最颠覆的一点。文件明确提出探索以“词元（Token）”为基础的数据价值体系。未来，数据可能不再是一整个硬盘卖，而是像计流量一样，按使用的Token量计费。数据真的变成了像石油一样的硬通货。

4、“一次测评，全国互认”

以后数据集也要有“合格证”了。通过测评的数据，在全国都能流通，这解决了企业之间不敢共享数据的大难题。

谁会受益？

如果你在工业制造、医疗、金融、低空经济、智慧城市这些领域，或者你是做数据服务、AI模型的，这就是最大的政策红包。国家正在打通“场景数据模型”的闭环，谁手里有高质量数据，谁就掌握了AI时代的金钥匙。

相关快讯