开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >Token Plan >Token Plan 是如何计费的？

Token Plan 是如何计费的？

修改于 2026-05-21 11:08:02

4

词条归属：Token Plan

Token Plan 的计费机制因平台而异，但核心逻辑均为「包月订阅 + 额度抵扣」模式，用户购买套餐后获得固定额度，在有效期内调用模型时从套餐包中实时扣减。

计费通常区分输入 Token（命中缓存/未命中缓存）与输出 Token 分别计价，不同模型单价不同。部分平台采用 Credits 统一计量体系，单次消耗的 Credits 由模型类型、Token 用量、是否开启思考模式及工具调用等动态决定。

以腾讯云 Token Plan 为例，个人版采用 Token 额度包月制，订阅后获得固定 Token 配额，调用时实时从套餐包中扣减 Token 量。以通用 Token Plan 支持的模型为例，DeepSeek-V4-Flash 输入（未命中缓存）为 100 积分/百万 tokens，输出为 200 积分/百万 tokens；MiniMax-M2.5 输入（未命中缓存）为 210 积分/百万 tokens，输出为 840 积分/百万 tokens。

企业版则采用积分池机制，用户按自定义月预算购买积分池，调用模型时按各模型的 Token 单价从积分池中实时扣减，不同模型单价不同，支持多 Key 配额分配，适合企业级场景统一管理。

相关文章

Token plan 取代 Coding plan 的必然性

腾讯云Token Plan

最初 Open AI 及 Anthropic 以订阅制收取费用及 Token 计费两种形式提供服务，订阅制可用 token 量更大但限制请求次数，Token 计费形式请求次数限制较为宽松，但 Token 使用量上来后费用容易爆炸。而在 Claude code 及 Codex、copilot、open code 等编程 CLI/IDE 出现后，按 prompt 次数/请求次数计费的方式开始流行。彼时国内大模型厂商因模型能力不足、用户信任度等原因，虽也推出 Coding plan ，但鲜有人关注/购买。而到了 2025 年第三季度，GLM 4.X 系列、MiniMax 2.X系列、Kimi 2.X 系列模型的发布，使得国内开发者将部分注意力转移至国产大模型上。直到 2026 年 OpenClaw 在国内爆火，其对于 Token 的巨量需求与 Coding plan 的低价量大结合，共同推动 OpenClaw 与 Coding plan 双双热销。

2026-04-10

1.6K2

DeepSeek为什么按Token计费 —— 通俗解释什么是大模型Token

人工智能小程序 token 微信小程序

最近 DeepSeek 可是火遍了大模型圈，我也一直在研究。结果前几天，我发小突然冷不丁地问我：“大模型里的Token 到底是啥东西啊？” 这问题可把我问住了，一时之间竟不知从何说起。我就跟她打比方，说像Deepseek、GPT 这些大语言模型，都有个“厉害助手”叫分词器。当大模型收到一段文字，就会让分词器把它切成好多小块，这些小块就叫token。比如说 “我喜欢唱、跳、Rap 和篮球”这句话，在大模型里可能就会被切成这样，单个汉字、两个汉字组成的词语、三个字的常见短语、标点符号、单词或者几个字母组成的词缀，都有可能是一个token。而且大模型输出文字的时候，也是一个token一个token往外蹦，所以有时候看起来就像在打字一样。

2025-03-18

4K0

腾讯云Token Plan深度解析：39元起畅用OpenClaw，比API按量计费省80%的秘密

腾讯云Token Plan OpenClaw(Clawdbot)

AI领域的Token消费也是一样。绝大多数开发者还在用"零售"模式——按量计费，每个Token都算钱。而腾讯云推出的 Token Plan，就是"批发"模式，让你用远低于市价的成本，获得充足的Token配额。

2026-03-27

10.5K2

Fundebug计费标准解释：事件数是如何定义的？

Fundebug提供了多个不同档位的付费套餐，其主要收费标准是按照事件数来确定的。当前Fundebug各个付费套餐每月的事件数及其价格如下表：

2019-12-30

9060

大模型API的token是如何计算的？

LLM 腾讯混元大模型

在我们日常使用大语言模型（LLM）API 时，比如 OpenAI、Anthropic 或其他厂商的接口，token 数量几乎是一个绕不开的问题。无论是控制调用成本，还是预估模型上下文长度，都离不开对 token 计算方式的理解。比如我在某个平台调用大模型API的时候就会有一些相关的参数：

2025-11-10

3.4K0

点击加载更多

词条知识树 8个知识点