Token Plan 的计费机制因平台而异,但核心逻辑均为「包月订阅 + 额度抵扣」模式,用户购买套餐后获得固定额度,在有效期内调用模型时从套餐包中实时扣减。
计费通常区分输入 Token(命中缓存/未命中缓存)与输出 Token 分别计价,不同模型单价不同。部分平台采用 Credits 统一计量体系,单次消耗的 Credits 由模型类型、Token 用量、是否开启思考模式及工具调用等动态决定。
以腾讯云 Token Plan 为例,个人版采用 Token 额度包月制,订阅后获得固定 Token 配额,调用时实时从套餐包中扣减 Token 量。以通用 Token Plan 支持的模型为例,DeepSeek-V4-Flash 输入(未命中缓存)为 100 积分/百万 tokens,输出为 200 积分/百万 tokens;MiniMax-M2.5 输入(未命中缓存)为 210 积分/百万 tokens,输出为 840 积分/百万 tokens。
企业版则采用积分池机制,用户按自定义月预算购买积分池,调用模型时按各模型的 Token 单价从积分池中实时扣减,不同模型单价不同,支持多 Key 配额分配,适合企业级场景统一管理。