欢迎大家关注“凯哥讲故事系列”公众号,我是凯哥
给你最本质,最实战的数字化转型指南

大贵收到一封内部邮件,标题很短,杀伤力很大:
《本周起:推理服务限流》
邮件正文更短:
·GPU 用量超标
·预算燃尽提前 18 天
·业务侧请“减少无意义调用”
·技术侧请“优化 prompt、降低 token”
大贵看完就笑了,笑得有点冷:
大贵:你看,AI 还没替代人类,人类先被 AI 的账单替代了。
大富:这就是今天的大模型:不是不会干活,是太爱逐字表演。
大贵:表演得越认真,账单越像判决书。
2025 年 12 月 31 日,arXiv 出了一篇论文:DLCM(Dynamic Large Concept Models)。名字很学术,但它讲的道理特别人话:
一句话讲透:
现在的大模型最大的浪费,是“每句话里,废话和重点用了一样多的脑子”。
传统模型像一个员工:
·“的、了、啊、嗯”也要认真想;
·“但是、所以、关键在于”也要认真想;
·每个字同价。
DLCM 说:不行。语言里有大量“可预测的铺垫”,
真正值钱的是“语义拐点”(转折、因果、结论)。
所以模型要学会把一串字压缩成“概念块(concept)”,废话轻算、重点深算。
论文还给了一个非常直白的结果:在平均“4 个 token ≈ 1 个概念块”的设定下,把约 1/3 的推理计算挪给更强的推理骨干,在 12 个 zero-shot 基准上平均提升 2.69%(同等推理预算)。
大富:以前是“按字数结算”。
大贵:现在它说:不,应该“按重点结算”,或“按价值结算”。
你对员工说:
方案大体可行,但关键风险在合规;先上试点,再放量。
传统大模型像“逐粒嚼米”:每个字都嚼 30 下。成熟员工是“吃到骨头才啃”:
·关键风险:合规
·策略:试点→放量
DLCM 就是要让模型学会:米饭别嚼了,骨头才值得嚼。
旧模型像仓库全靠人工搬:空纸箱也两个人抬,保险柜也两个人抬,结果老板买单买到破产。
DLCM 把仓库改造为:空纸箱叉车一推就走(轻算),保险柜叫专业队伍慢慢拆(重算)。一句话:算力终于有了等级制度。
旧模型(Token 平权社会) [这][个][方][案][大][体][可][行][但][关][键][风][险][在][合][规] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 (每个字都收费) DLCM(重点计费社会) [铺垫/客套/可预测段] ——轻算→→ [但是/所以/关键在于/结论段] ——重算↓↓↓
旧仓库(全人工) 空纸箱 ──两个人抬──> 也收费 保险柜 ──两个人抬──> 也收费 结论:成本跟“搬了多少东西”走,不跟“值不值钱”走 新仓库(DLCM) 空纸箱 ──叉车推走──> 便宜 保险柜 ──专业队拆──> 贵但值 结论:成本跟“重点”走
2026 省钱模式:废话不配用算力 ↓ 2027 精读模式:长上下文从“能塞下”变成“会读懂” ↓ 2028 治理模式:推理/Agent 的“想多久、想多深”变成可运营成本
大贵:以前模型比聪明。
大富:以后模型比“谁更像成熟员工”。
同样预算,谁能把算力从“水词”挪到“拐点”,谁更强更便宜。
2M 字不是能力,从 2M 字里自动挑出 20% 的关键段落深算才是能力。
推理模型的最大问题是:一认真就加班,一加班就烧钱。DLCM 的方向是:别到处想,在关键处想深一点。
如果说“行业学 DLCM 是为了更强”,那“字节学 DLCM 可能首先是为了更省”,这也是典型的“字节调性“”
大富:字节不是最爱论文的公司。
大贵:字节是最爱把论文变成“成本曲线”的公司。
字节公开的很多硬论文,讲的都是同一件事:怎么把大模型做成工厂——能练出来、练得稳、练得久、练得起规模。
模型能力当然做,但更高频、更硬核的是“基础设施与生产体系”——因为那决定了它能不能把研究变成利润,比如:
A)最新爆点:把计算单位从 token 改成 concept
大富:
这 13 篇要是放在别家公司,是“研究成果”。
大贵:
放在字节,这是“生产线说明书 + 产品线目录”。
所以 字节发表DLCM 这种“按重点计费”的方法,在字节最可能按这个顺序落地:
·先在线推理降本:同样机器多跑用户、同样延迟更准
·再长内容精读:直播、评论楼、长文——只在关键段落深算
·最后嫁接推理模型:让“先想再答”变成“在关键处想深一点”
大富:未来三年,AI 最大战争不是参数战争。
大贵:是账单战争。
宣传口径会从“更聪明”变成:同价更快 / 同延迟更准 / 同机器并发更高。
竞争不在“谁能塞 2M”,而在“谁能把 2M 里最值钱的 20% 抠出来深算”。
“想多久、想多深”变成可运营成本。企业会像管人一样管模型:该想就想,不该想别演,关键节点必须想对。
大富:以前大模型收费像出租车,按里程计费。
大贵:DLCM 说不,应该按“你有没有到目的地”计费。
大富:而字节最危险的地方在于——一旦它认定“钱烧错了地方”,它会把“正确烧钱的方法”,做成行业标准。
富贵研究所,是「凯哥讲故事」旗下的产业观察栏目与长期研究计划。
聚焦 AI 时代的产业变化,把技术进展转化为更易理解的行业语言:通过真实场景、关键事件与可验证的推演,分析商业模式、组织分工与新型入口的演化方向。每篇文章力求做到三点:讲清趋势、讲透逻辑、给出可落地的参考框架。文中偶尔引用“大富”“大贵”的一句点评,作为观察视角的点睛。
欢迎关注富贵研究所,一起把变化看懂、把选择做稳。
欢迎加入「富贵研究所」
洞察 AI 时代,找到富贵之路
END
AI 转型交付式咨询服务
场景培育交付式咨询服务
企业数字化转型/场景识别、共创、落地
精益数据训练营/解决方案架构师特训营
从数据到价值:精益数据工作坊
数字化咨询教练陪跑服务:
数字化转型规划 | 顶层设计 |企业创新与运营
IT战略规划 | IT服务管理体系 | 数据治理