首页
学习
活动
专区
圈层
工具
发布
技术百科首页 >Token Plan >Token Plan 是如何计费的?

Token Plan 是如何计费的?

词条归属:Token Plan

Token Plan 的计费机制因平台而异,但核心逻辑均为「包月订阅 + 额度抵扣」模式,用户购买套餐后获得固定额度,在有效期内调用模型时从套餐包中实时扣减。

计费通常区分输入 Token(命中缓存/未命中缓存)与输出 Token 分别计价,不同模型单价不同。部分平台采用 Credits 统一计量体系,单次消耗的 Credits 由模型类型、Token 用量、是否开启思考模式及工具调用等动态决定。

以腾讯云 Token Plan 为例,个人版采用 Token 额度包月制,订阅后获得固定 Token 配额,调用时实时从套餐包中扣减 Token 量。以通用 Token Plan 支持的模型为例,DeepSeek-V4-Flash 输入(未命中缓存)为 100 积分/百万 tokens,输出为 200 积分/百万 tokens;MiniMax-M2.5 输入(未命中缓存)为 210 积分/百万 tokens,输出为 840 积分/百万 tokens。

企业版则采用积分池机制,用户按自定义月预算购买积分池,调用模型时按各模型的 Token 单价从积分池中实时扣减,不同模型单价不同,支持多 Key 配额分配,适合企业级场景统一管理。

相关文章
Token plan 取代 Coding plan 的必然性
最初 Open AI 及 Anthropic 以订阅制收取费用及 Token 计费两种形式提供服务,订阅制可用 token 量更大但限制请求次数,Token 计费形式请求次数限制较为宽松,但 Token 使用量上来后费用容易爆炸。 而在 Claude code 及 Codex、copilot、open code 等编程 CLI/IDE 出现后,按 prompt 次数/请求次数计费的方式开始流行。彼时国内大模型厂商因模型能力不足、用户信任度等原因,虽也推出 Coding plan ,但鲜有人关注/购买。而到了 2025 年第三季度,GLM 4.X 系列、MiniMax 2.X系列、Kimi 2.X 系列模型的发布,使得国内开发者将部分注意力转移至国产大模型上。直到 2026 年 OpenClaw 在国内爆火,其对于 Token 的巨量需求与 Coding plan 的低价量大结合,共同推动 OpenClaw 与 Coding plan 双双热销。
TomoriNao
2026-04-10
1.6K2
DeepSeek为什么按Token计费 —— 通俗解释什么是大模型Token
最近 DeepSeek 可是火遍了大模型圈,我也一直在研究。结果前几天,我发小突然冷不丁地问我:“大模型里的Token 到底是啥东西啊?” 这问题可把我问住了,一时之间竟不知从何说起。我就跟她打比方,说像Deepseek、GPT 这些大语言模型,都有个“厉害助手”叫分词器。当大模型收到一段文字,就会让分词器把它切成好多小块,这些小块就叫token。比如说 “我喜欢唱、跳、Rap 和篮球”这句话,在大模型里可能就会被切成这样 ,单个汉字、两个汉字组成的词语、三个字的常见短语、标点符号、单词或者几个字母组成的词缀,都有可能是一个token。而且大模型输出文字的时候,也是一个token一个token往外蹦,所以有时候看起来就像在打字一样。
网晨科技
2025-03-18
4K0
腾讯云Token Plan深度解析:39元起畅用OpenClaw,比API按量计费省80%的秘密
AI领域的Token消费也是一样。绝大多数开发者还在用"零售"模式——按量计费,每个Token都算钱。而腾讯云推出的 Token Plan,就是"批发"模式,让你用远低于市价的成本,获得充足的Token配额。
用户11721088
2026-03-27
10.5K2
Fundebug计费标准解释:事件数是如何定义的?
Fundebug提供了多个不同档位的付费套餐,其主要收费标准是按照事件数来确定的。当前Fundebug各个付费套餐每月的事件数及其价格如下表:
Fundebug
2019-12-30
9060
大模型API的token是如何计算的?
在我们日常使用大语言模型(LLM)API 时,比如 OpenAI、Anthropic 或其他厂商的接口,token 数量几乎是一个绕不开的问题。无论是控制调用成本,还是预估模型上下文长度,都离不开对 token 计算方式的理解。比如我在某个平台调用大模型API的时候就会有一些相关的参数:
闫同学
2025-11-10
3.4K0
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券