搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

Token计量与费用归因体系设计
月初预算批了10万，月底账单来了20万。问财务：钱花哪了？财务说：只知道总额，不知道细节。问IT：哪个部门花的？IT说：账号太多了，分不清。问业务：花得值不值？业务说：大家都在用，但没人统计。二、成本失控的根因分析根因一：计量颗粒度太粗传统IT成本计量以“实例”或“账号”为单位。但AI成本是以“Token”为单位的——每次调用消耗数百到数千Token，单价低、频次高、总量大。没有精细化的Token计量，就无法回答“谁、什么时候、用什么模型、花了多少Token”。根因二：缺少多维度归因能力一个Token消耗背后涉及多个维度：哪个部门？市场部还是研发部？哪个项目？设计要点：要点一：统一计量口径不同模型的Token计价方式不同（有的按输入+输出分别计费，有的按总Token计费）。计量系统需要：统一采集每次调用的输入Token数、输出Token数记录模型名称、调用时间、响应耗时保留原始请求和响应（用于审计和复盘）要点二：实时计量流采用流式计量架构：模型调用完成 → 异步写入计量队列计量消费者聚合数据
30910编辑于 2026-05-12
Token 计量与费用归因体系的设计
大模型调用的成本有几个特殊性：· 按量计费，弹性大：一个写得差的 prompt 可能比写得好的多用 3 倍 token，成本差异完全不透明· 多项目共用 Key：研发、运营、客服都在用同一套 API 无法拆分到各业务线· 用量行为难预测：某个员工突然开始用 AI 批量处理数据，当月成本暴增，事后才发现· 模型价格不一致：GPT-4o 和 GPT-4o-mini 单价差 20 倍，但用户选择模型往往没有约束二、计量体系的设计 2.1 归因维度要做有意义的费用报告，至少需要以下几个归因维度：计量记录（每次 LLM 调用）：{ 'timestamp': '2026-03-15T10:23:45Z', 'model': ' token 比，比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段4.1 Prompt 压缩input token 是成本的大头。 ZGI（zgi.cn）的费用管控模块提供了从计量、归因到预算预警的完整体系，支持按部门独立预算管理。
75810编辑于 2026-03-26
来自专栏全栈程序员必看
matlab空间计量模型AIC和SC,空间计量模型
第二列(value)是各个统计量的值，比如LM lag就是统计量等于0.238，服从自由度为1的卡方分部。下面的差不多。第三列(Prob)应该是对应的P value。
81940编辑于 2022-11-01
来自专栏PyStaData
计量笔记｜异方差
1.2 异方差的后果存在异方差的情况下：估计量无偏：用 OLS 估计所得参数估计量仍具有无偏性，即。 ---- 【问题】为什么 LM 统计量是呢? 在大样本中，与检验整个方程显著性的 F 统计量渐近等价。计算 F 统计量或者 LM 统计量并计算 p 值。（前者使用分布，后者使用分布）。如果这个 p 值很小，即低于选定的显著性水平，那么就拒绝同方差性的原假设。 )，即在完成估计后所计算的后续统计量。使用 OLS 时，变量 lnpl 的 p 值为 0.13，在 10% 的水平上也不显著; 使用 WLS 后，该变量的 p 值变为 0.002，在 1% 的水平上显著不为 0。
7.8K20发布于 2021-03-05
来自专栏从零开始学自动化测试
python接口自动化10-token登录
一、登录返回token 1.如下图的这个登录，无cookies ? 2.但是登录成功后有返回token 二、请求头带token 1.登录成功后继续操作其它页面，发现post请求的请求头，都会带token参数 ? 2.这种请求其实比cookie更简单，直接把登录后的token放到头部就行三、token关联 1.用脚本实现登录，获取token参数，获取后传参到请求头就可以了 2.如果登录有验证码，前面的脚本登录步骤就省略了 ()["token"] # 这是登录后发的一个post请求 post_url = "http://xxx" # 添加token到请求头 header["token"] = token # 如果这个post 传token的方式也有几种，有的传在头部，有的在url里。
1.9K40发布于 2018-04-08
来自专栏代码简单说
TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法
TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法关键词：TRAE教程、Token成本优化、AI编程成本、上下文管理、AI Coding 提问技巧、AI IDE 使用技巧一、先搞懂 Token 是怎么花掉的一次 AI 对话的费用本质上可以理解为：总费用 = 未命中缓存的输入 Token × 输入单价 + 输出 Token × 输出单价 + 缓存 Token × 缓存单价（如有） Token 主要来自 3 个部分：类型来源输入 Token 提问内容、历史对话、引用代码/文件输出 Token AI返回内容、代码、工具调用缓存 Token 长对话复用的上下文关键结论三、10 个 Token 节省实战技巧技巧1：新开对话，比继续聊更省钱长对话 = 隐形 Token 黑洞。技巧10：任务匹配模型不要所有任务都用最强模型。
23910编辑于 2026-06-16
来自专栏机器学习与统计学
【温习统计学】无偏估计量、相合估计量
无偏估计量，数学期望等于被估计的量的统计估计量。设^θ(X1,X2,…,Xn)是θ的估计量，若E(^θ)=θ，对一切θ∈Θ，则称^θ为θ的无偏估计量，否则称为θ的有偏估计量。估计量的一种大样本性质:当样本容量n充分大时,估计量可以以任意的精确程度逼近被估计参数的真值。设n＝T (X1,X2,…,Xn)是未知参数θ∈Θ的估计量,其中Θ是θ的值域。
6K30发布于 2019-04-10
来自专栏PyStaData
计量笔记｜拟合优度
*/ clear set obs 500 gen id = _n gen r2 = . gen y = int(10*runiform()) //生成被解释变量 forvalues i = 1/200 { gen x`i' = 10*runiform() //生成解释变量 } forvalues c = 1/200{ //逐步加入解释变量 if `c' == 1 { reg 自由度是指当以样本的统计量来估计总体的参数时，样本中独立或能自由变化的数据的个数，称为该统计量的自由度。通常为。比如，若存在两个变量，而那么自由度为 1 。计量经济学导论（第 5 版）[M]. 北京: 中国人民大学出版社. [2] 陈强, 2015. 计量经济学及 Stata 应用[M]. 经济计量学精要（第 4 版）[M]. 机械工业出版社. [4] 李·C·阿迪金斯, 卡特·希尔, 2015. 应用 Stata 学习计量经济学原理（第 4 版）[M]. 重庆：重庆大学出版社.
6.8K30发布于 2021-04-13
来自专栏CodeGuide | 程序员编码指南
QClaw干掉10亿Token，做出2个精致skills！
但因为使用的都是自己的Token，有点舍不得站起来蹬，感觉每一句话都在烧钱。相比较下OpenClaw同样一个事的消耗程度，是其他AIIDE（Trae.ai）的上百倍，那直接用其他的不也可以吗！？但不深度玩，不干它几亿Token，就不能体验到花钱的快乐！好在呀，好在QClaw每天一个登录的账号，赠送4000万Token。换5个微信（还得家里人多），就是2亿Token！几十亿Token下去后，我的体验是；它能干活，能想一个你的员工一样，控制这台电脑干活。包括，可以按照需求写代码，完成编译、构建、部署，打开浏览器验证功能逻辑，对于错误的编码可以继续完善。先拿10亿Token，写2个Skills之后再说（先把腿接上）。——把你工作的方式，训练成技能，让AI懂你！接下来，小傅哥就分享下，用OpenClaw（QClaw）做的一些事。只要有Token就想让AI继续搞。软件工程交付，需要的不只是代码，还包括完整的理解代码，代码与产品PRD完全匹配，从而形成代码资产。
1.6K160编辑于 2026-03-30
来自专栏区块链入门
叶开：Token设计画布与10大设计模式
Token经济设计专家叶开，通过多年的企业实践经验总结而出的Token设计画布与10大设计模式，为企业提供最全面的实现参考。而同时叶开也结合实践总结出了Token经济模式设计画布及10大设计模式。 Token模式、模板化Token模式以及实现Token模式的通用语言。 Token经济的10大设计模式为了传统企业能够简单便捷的理解Token和Token的设计，叶开提炼了10类Token模式，这些模式可以帮助传统企业快速理解Token的变化和组合，并且可以作为模板来分析和套用自己企业相对应的本文转载自《专访Token经济设计专家叶开：Token设计画布与10大设计模式》，版权属于原作者
1.1K40发布于 2018-08-10
来自专栏YoungGy
ISLR_t统计量
mean inference for comparing two independent means inference for comparing two paired means 回顾之前讲了Z统计量 Z统计量的总体逻辑是：假设H0成立，建立群体均值的正态分布。正态分布的均值是总体均值，标准差是σ/n−−√\sigma /\sqrt{n}，σ\sigma一般用ss估计。
96850发布于 2018-01-02
来自专栏DearXuan的博客文章
算法基础-顺序统计量
顺序统计量将长度为 n 的数组升序排序后，则第 i 个位置的数字是该数组的第 i 小的量，称之为第 i 顺序统计量数组最小值是第1个顺序统计量，最大值是第n个顺序统计量，中位数(又称下中位数)是第⌊ (n+1)/2⌋个顺序统计量 ⌊n⌋ 表示对 n 向下取整，⌈n⌉表示对 n 向上取整最大值和最小值若想要寻找n个数字里的最大值或最小值，只需要进行(n-1)次比较 int min = a[0]; i += 2; } cout << "min:" << min << endl; cout << "max:" << max << endl; } 第i顺序统计量如果想要找到数组里的第 i 顺序统计量，也就是第 i 小的数字，通常的办法是把整个数组排序，然后直接取出对应位置的数字。
1.1K60编辑于 2022-01-31
来自专栏技术学习笔记
因果推断常用计量方法
干预效应(Treatment Effect)：干预问题的基础是量化干预效应，常用的计量指标包括: (1). 分为30岁和40岁年龄组，每组都有服药和未服药的个体，观测数据如下[1]：年龄未服药（平均身体健康指数）服药（平均身体健康指数）健康状况差异（服药-未服药） 30岁 80 (6) 90 (2) 10 因此直接对整体计量时，相关关系与因果关系是相悖的。使用相关关系刻画因果关系时，应该控制混淆变量(例如按年龄段分组)，用来消除虚假的因果关系。常用计量方法随机对照试验因果推断的一条黄金法则：随机对照试验(AB测试) 是确定因果关系最可靠的方法 [3]。常用于计算复杂随机变量的方差、标准差等统计量，从而简化概率推断的计算过程。
1.6K34编辑于 2025-02-09
来自专栏大大的小数据
cluade现在有10万token了之二不错2023.6.5
1、5.15想测试cluade1万token，没有plus无疾而终，今天有plus了 https://mp.weixin.qq.com/s/4VxSI2xlc6bXpAd-L_a08A 2、 3、https 1641889853162995712 垃圾视频 https://www.zhihu.com/question/600571085/answer/3024626500 GPT4 对手 Claude 史诗升级，一次提取十万 token 还行 10、文章认为有哪些AI技术值得关注？为什么？点get到了 11、分别告诉我第1、2、3、4、5讲课程，都引用了哪些例子，解释了什么内容？
43720编辑于 2023-09-11
来自专栏生物信息与临床医学专栏
关于F统计量的澄清
一般而言，当F 统计量大于经验值10时，我们认为工具变量法估计值的偏倚大约是观察性研究的10%，因此F大于10这个标准在孟德尔随机化研究中广为使用。然而，这样的盲目使用不见得是合理的。早在2011年，Stephen Burgess等学者就提出盲目且单一使用F统计量大于10来判断弱工具变量偏倚是不合理，为此他们利用哥本哈根队列（Copenhagen General Population 个子队列的平均F统计量。从上表中我们不难看出，随着均分的子队列数目增加，观察性估计量比较稳定，2SLS和LIML的估计值和实际观察值越来越接近，但是每个子队列的平均F统计量在不断减少。从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的，当然我们这里并不是否认F统计量的作用，在实际研究中，F统计量越大，确实偏倚会小，但不能拿F大于10作为“金标准”。
3.2K21编辑于 2022-08-21
来自专栏机器之心
微软新出热乎论文：Transformer扩展到10亿token
机器之心报道机器之心编辑部已经扩展到了10亿token，未来能否将整个互联网作为一个序列处理？在微软最新的一项研究中，他们这次直接将 Transformer 扩展到 10 亿 token。这为建模非常长的序列开辟了新的可能性，例如将整个语料库甚至整个互联网视为一个序列。 https://github.com/microsoft/unilm/tree/master 具体而言，该研究提出了 LONGNET，这是一种 Transformer 变体，可以将序列长度扩展到超过 10 然而，这些方法尚未将 Transformer 扩展到 10 亿 token 的规模（参见图 1）。下表为不同计算方法的计算复杂度比较。N 为序列长度，d 为隐藏维数。方法该研究的解决方案 LONGNET 成功地将序列长度扩展到 10 亿个 token。
50120编辑于 2023-08-07
来自专栏用户8955222的专栏
计量模型 | 前定变量#时间FE
最近在某年会的学术汇报上看到一篇DID实证论文，不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库，但却用于评估2017年实施的某项政策的政策效应。
1.2K20发布于 2021-11-10
来自专栏新智元
next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+
多token预测标准语言模型通过执行一个「下一个token预测」任务来对大型文本语料库进行学习，任务目标是最小化交叉熵损失，其中模型需要最大化「在给定之前token序列历史的条件下，预测下一个token z，然后再把该表征送入到n个独立的头网络，以并行的方式预测每一个未来token 多token预测的交叉熵损失可以分解为两部分：在给定token序列下的潜表征，以及在该潜表征条件下，预测n个未来token 实验结果显示，使用4个未来token进行训练时，在HumanEval和MBPP的所有pass at 1, 10和100指标上均超越了其他对比模型：MBPP的改进分别为+3.8%, +2.1%和+3.2% 微调多token预测器在机器学习领域，预训练模型通过多token预测损失函数进行训练，相较于传统的单token预测模型，该方法在后续的微调阶段展现出了更好的性能。在自然语言上的多token预测研究人员训练了参数量为7B的模型，并使用了三种不同的预测损失方法：预测4token、2-token以及单个token，并在6个标准的自然语言处理（NLP）基准测试中进行了性能评估
87810编辑于 2024-06-05
来自专栏YoungGy
统计简单学_常用统计量
连续型数据特征数据特征值的应用经验法则盒须图连续型数据特征集中趋势平均数中位数(群体η\eta，样本X̃ \tilde{X}) 众数选择：当群体中有离群值时，使用中位数或者众数，
92540发布于 2019-05-27
来自专栏GiantPandaCV
解析 Token to Token Vision Transformer
最后看下T2T，通过Token to Token结构（下文会讲），它在浅层的时候也能建模出结构信息，同时也避免了极值的出现。 Token To Token结构 ? 这样会逐渐减少token的数量，但随之而来token的长度会增加很多（因为多个tokens连接在一个token），因此后续模型也降低了维度数目，以平衡计算量。 2, 3], [4, 5, 6], [7, 8, 9]], [[10 [ 2., 3., 5., 6.], [ 4., 5., 7., 8.], [ 5., 6., 8., 9.], [10 整体架构 T2T架构如上图所示，先经过2次Tokens to Token操作，最后给token加入用于图像分类的cls token，并给上位置编码（position embedding)，送入到Backbone
8.1K10发布于 2021-03-11

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Token计量与费用归因体系设计

Token 计量与费用归因体系的设计

matlab空间计量模型AIC和SC,空间计量模型

计量笔记｜异方差

python接口自动化10-token登录

TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法

【温习统计学】无偏估计量、相合估计量

计量笔记｜拟合优度

QClaw干掉10亿Token，做出2个精致skills！

叶开：Token设计画布与10大设计模式

ISLR_t统计量

算法基础-顺序统计量

因果推断常用计量方法

cluade现在有10万token了之二不错2023.6.5

关于F统计量的澄清

微软新出热乎论文：Transformer扩展到10亿token

计量模型 | 前定变量#时间FE

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

统计简单学_常用统计量

解析 Token to Token Vision Transformer

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Token计量与费用归因体系设计

Token 计量与费用归因体系的设计

matlab空间计量模型AIC和SC,空间计量模型

计量笔记 ｜ 异方差

python接口自动化10-token登录

TRAE如何节省token额度教程(二)Token 节省技巧的10 个实战方法

【温习统计学】无偏估计量、相合估计量

计量笔记 ｜ 拟合优度

QClaw干掉10亿Token，做出2个精致skills！

叶开：Token设计画布与10大设计模式

ISLR_t统计量

算法基础-顺序统计量

因果推断常用计量方法

cluade现在有10万token了之二不错2023.6.5

关于F统计量的澄清

微软新出热乎论文：Transformer扩展到10亿token

计量模型 | 前定变量#时间FE

next-token被淘汰！Meta实测「多token」训练方法，推理提速3倍，性能大涨10%+

统计简单学_常用统计量

解析 Token to Token Vision Transformer

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

计量笔记｜异方差

计量笔记｜拟合优度