搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

Token计量与费用归因体系设计
二、成本失控的根因分析根因一：计量颗粒度太粗传统IT成本计量以“实例”或“账号”为单位。但AI成本是以“Token”为单位的——每次调用消耗数百到数千Token，单价低、频次高、总量大。没有精细化的Token计量，就无法回答“谁、什么时候、用什么模型、花了多少Token”。根因二：缺少多维度归因能力一个Token消耗背后涉及多个维度：哪个部门？市场部还是研发部？哪个项目？设计要点：要点一：统一计量口径不同模型的Token计价方式不同（有的按输入+输出分别计费，有的按总Token计费）。计量系统需要：统一采集每次调用的输入Token数、输出Token数记录模型名称、调用时间、响应耗时保留原始请求和响应（用于审计和复盘）要点二：实时计量流采用流式计量架构：模型调用完成 → 异步写入计量队列计量消费者聚合数据要点三：计量数据分层存储热存储（最近7天）：实时查询，用于监控和告警温存储（最近90天）：日常报表和分析冷存储（90天以上）：合规审计和长期趋势分析四、费用归因模型设计有了计量数据后，需要建立归因模型，
30410编辑于 2026-05-12
Token 计量与费用归因体系的设计
大模型调用的成本有几个特殊性：· 按量计费，弹性大：一个写得差的 prompt 可能比写得好的多用 3 倍 token，成本差异完全不透明· 多项目共用 Key：研发、运营、客服都在用同一套 API 无法拆分到各业务线· 用量行为难预测：某个员工突然开始用 AI 批量处理数据，当月成本暴增，事后才发现· 模型价格不一致：GPT-4o 和 GPT-4o-mini 单价差 20 倍，但用户选择模型往往没有约束二、计量体系的设计 2.1 归因维度要做有意义的费用报告，至少需要以下几个归因维度：计量记录（每次 LLM 调用）：{ 'timestamp': '2026-03-15T10:23:45Z', 'model': ' token 比，比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段4.1 Prompt 压缩input token 是成本的大头。 ZGI（zgi.cn）的费用管控模块提供了从计量、归因到预算预警的完整体系，支持按部门独立预算管理。
75810编辑于 2026-03-26
来自专栏全栈程序员必看
matlab空间计量模型AIC和SC,空间计量模型
第二列(value)是各个统计量的值，比如LM lag就是统计量等于0.238，服从自由度为1的卡方分部。下面的差不多。第三列(Prob)应该是对应的P value。
81940编辑于 2022-11-01
来自专栏PyStaData
计量笔记｜异方差
1.2 异方差的后果存在异方差的情况下：估计量无偏：用 OLS 估计所得参数估计量仍具有无偏性，即。 ---- 【问题】为什么 LM 统计量是呢? 在大样本中，与检验整个方程显著性的 F 统计量渐近等价。计算 F 统计量或者 LM 统计量并计算 p 值。（前者使用分布，后者使用分布）。如果这个 p 值很小，即低于选定的显著性水平，那么就拒绝同方差性的原假设。 )，即在完成估计后所计算的后续统计量。计量经济学导论（第五版）[M]. 北京: 中国人民大学出版社.
7.8K20发布于 2021-03-05
来自专栏机器学习与统计学
【温习统计学】无偏估计量、相合估计量
无偏估计量，数学期望等于被估计的量的统计估计量。设^θ(X1,X2,…,Xn)是θ的估计量，若E(^θ)=θ，对一切θ∈Θ，则称^θ为θ的无偏估计量，否则称为θ的有偏估计量。估计量的一种大样本性质:当样本容量n充分大时,估计量可以以任意的精确程度逼近被估计参数的真值。设n＝T (X1,X2,…,Xn)是未知参数θ∈Θ的估计量,其中Θ是θ的值域。
6K30发布于 2019-04-10
来自专栏苏三说技术
微服务Token鉴权的7种方案
前言最近有球友问我：微服务中Token鉴权除了使用JWT之外，还有什么其他的方案？今天这篇文章跟大家一起聊聊微服务Token鉴权的7种方案，希望对会有所帮助。 1. 为什么必须做Token鉴权？ .setSigningKey(SECRET_KEY) .parseClaimsJws(token) .getBody(); // 若Token被注销仍能解析通过！：必须使用PKCE扩展防止授权码截持攻击方案3：Sa-Token轻量级框架该方案是的国产Token鉴权方案的精品。 " + token); } 安全加固：使用JWT嵌套加密防止内部Token泄露方案6：JWE加密令牌该方案能保证金融级安全。 ())); return jwe.serialize(); } 适用场景：支付凭证身份证号传输医疗健康数据方案7：双向TLS认证该方案是零信任架构。
80120编辑于 2025-08-06
来自专栏PyStaData
计量笔记｜拟合优度
（图片来源：古扎拉蒂《计量经济学精要》（第 4 版））如上图所示，将的总变异（TSS）分解为两部分，可以被回归分解（ESS） + 未被回归分解（RSS）。自由度是指当以样本的统计量来估计总体的参数时，样本中独立或能自由变化的数据的个数，称为该统计量的自由度。通常为。比如，若存在两个变量，而那么自由度为 1 。计量经济学导论（第 5 版）[M]. 北京: 中国人民大学出版社. [2] 陈强, 2015. 计量经济学及 Stata 应用[M]. 经济计量学精要（第 4 版）[M]. 机械工业出版社. [4] 李·C·阿迪金斯, 卡特·希尔, 2015. 应用 Stata 学习计量经济学原理（第 4 版）[M]. 重庆：重庆大学出版社.
6.8K30发布于 2021-04-13
来自专栏YoungGy
ISLR_t统计量
mean inference for comparing two independent means inference for comparing two paired means 回顾之前讲了Z统计量 Z统计量的总体逻辑是：假设H0成立，建立群体均值的正态分布。正态分布的均值是总体均值，标准差是σ/n−−√\sigma /\sqrt{n}，σ\sigma一般用ss估计。
96850发布于 2018-01-02
来自专栏DearXuan的博客文章
算法基础-顺序统计量
顺序统计量将长度为 n 的数组升序排序后，则第 i 个位置的数字是该数组的第 i 小的量，称之为第 i 顺序统计量数组最小值是第1个顺序统计量，最大值是第n个顺序统计量，中位数(又称下中位数)是第⌊ (n+1)/2⌋个顺序统计量 ⌊n⌋ 表示对 n 向下取整，⌈n⌉表示对 n 向上取整最大值和最小值若想要寻找n个数字里的最大值或最小值，只需要进行(n-1)次比较 int min = a[0]; i += 2; } cout << "min:" << min << endl; cout << "max:" << max << endl; } 第i顺序统计量如果想要找到数组里的第 i 顺序统计量，也就是第 i 小的数字，通常的办法是把整个数组排序，然后直接取出对应位置的数字。
1.1K60编辑于 2022-01-31
来自专栏技术学习笔记
因果推断常用计量方法
干预效应(Treatment Effect)：干预问题的基础是量化干预效应，常用的计量指标包括: (1). 未服药（平均身体健康指数）服药（平均身体健康指数）健康状况差异（服药-未服药） 30岁 80 (6) 90 (2) 10 40岁 60 (3) 65 (5) 5 所有 73.3 (9) 72.1 (7) 健康差异= \frac{(80\times6 + 60\times3）}{9} - \frac{(90\times2 + 65\times5）}{7} = 73.3 - 72.1 = -1.2 (2). 常用计量方法随机对照试验因果推断的一条黄金法则：随机对照试验(AB测试) 是确定因果关系最可靠的方法 [3]。常用于计算复杂随机变量的方差、标准差等统计量，从而简化概率推断的计算过程。
1.6K34编辑于 2025-02-09
来自专栏量化投资与机器学习
AQR最最最新 | 计量经济学应用投资失败的7个原因
什么是计量经济学？ William Greene, Econometric Analysis (2012, p.7) 至于其历史和学科介绍网上有很多，在此不再敖述。原因一：结构化数据计量经济数据相对乏味 1、信息最丰富的数据集适用于机器学习，但不适用于计量经济学。非结构化数据：所有可用数据中只有不到20％是结构化的。计量经济学研究估计反映虚假关系的贝塔系数。而且是可以实现的：计量经济学分析的每一步，都有一个对应的机器学习工具包。计量经济学应用量化投资案例
1.3K50发布于 2019-05-17
来自专栏生物信息与临床医学专栏
关于F统计量的澄清
在往期推送中，米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。一般而言，当F 统计量大于经验值10时，我们认为工具变量法估计值的偏倚大约是观察性研究的10%，因此F大于10这个标准在孟德尔随机化研究中广为使用。然而，这样的盲目使用不见得是合理的。从上表中我们不难看出，随着均分的子队列数目增加，观察性估计量比较稳定，2SLS和LIML的估计值和实际观察值越来越接近，但是每个子队列的平均F统计量在不断减少。也即说明，等分的子队列数目越多，工具变量估计值越接近真实值，但这时候F统计量可能是比较小的。从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的，当然我们这里并不是否认F统计量的作用，在实际研究中，F统计量越大，确实偏倚会小，但不能拿F大于10作为“金标准”。
3.2K21编辑于 2022-08-21
来自专栏YoungGy
统计简单学_常用统计量
连续型数据特征数据特征值的应用经验法则盒须图连续型数据特征集中趋势平均数中位数(群体η\eta，样本X̃ \tilde{X}) 众数选择：当群体中有离群值时，使用中位数或者众数，
92540发布于 2019-05-27
来自专栏GiantPandaCV
解析 Token to Token Vision Transformer
as np np_input = np.array([[[[1, 2, 3], [4, 5, 6], [7, unfolded) # 输出为 tensor([[[ 1., 2., 4., 5.], [ 2., 3., 5., 6.], [ 4., 5., 7. ') self.soft_split0 = nn.Unfold(kernel_size=(7, 7), stride=(4, 4), padding=(2, 2)) (dim=in_chans * 7 * 7, in_dim=token_dim, num_heads=1, mlp_ratio=1.0) self.attention2 = Token_transformer transpose(1, 2) # final tokens x = self.project(x) return x 首先设置三个划窗大小分别为7x7
8.1K10发布于 2021-03-11
来自专栏用户8955222的专栏
计量模型 | 前定变量#时间FE
最近在某年会的学术汇报上看到一篇DID实证论文，不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库，但却用于评估2017年实施的某项政策的政策效应。
1.2K20发布于 2021-11-10
因果推断常用计量方法
7. 断点回归 (Interrupted Time Series, ITS)原理：分析时间序列数据中某一事件（如政策实施）前后趋势的变化，以估计处理效应。优点：无需对照组，适合单一单位的研究。
81910编辑于 2025-02-21
来自专栏PyStaData
计量笔记｜简单线性回归
Generation Process reg y x tw function PRF = 1+2*x, range(-5 15) || /// scatter y x || lfit y x, lp(dash) 计量经济学的主要任务之一就是通过数据 1.1 OLS 估计量的推导目标：残差平方和最小此最小化问题的一阶条件为：消去方程左边的，可得：对上式各项分别求和，移项可得：上式为“正规方程组”。 (图片来源：古扎拉蒂《经济计量学精要》（第四版）p.54) 由上图可知，的观测值围绕其均值（total variation）可分解为两部分，一部分来自回归线（ESS），另一部分来自随机扰动（RSS 计量经济学及 Stata 应用[M]. 高等教育出版社. 古扎拉蒂, 波特, 2010. 经济计量学精要[M]. 机械工业出版社. 杰弗里·M·伍德里奇, 2015. 计量经济学导论（第五版）[M]. 北京: 中国人民大学出版社.
4.7K42发布于 2021-03-05
来自专栏全栈程序员必看
小米 token(token在哪里获取)
小米设备token获取&HomeAssistant安装部署小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 在使用这个局域网控制协议之前需要获取到设备token，接下来介绍小米设备获取token的一些方法。 :’,tok) 运行python3.5 miio_test.py，获取小米Wi-Fi插座token 执行控制脚本，输入插座的ip和token两个参数就可以看到现在插座的状态，在这两个参数的基础上添加接下来还有一种方法可以直接从app获取token。以小米绿米网关为例，首先下载米家app，将绿米网关配置入网后，点击网关设备。接下来步骤如下组图，最后的密码即为网关的token。目前绿米的这种设计模式是最方便用户的，而且设备的所有者还可以选择是否开放局域网控制以及刷新控制token的有效性，个人还是很希望小米的其他设备同样开放app侧获取设备token，因为毕竟获取需要搭建复杂的环境以及调试代码
10.7K10编辑于 2022-07-29
来自专栏CSDN小华
如何评价估计量的好坏
无偏性保证了估计量的长期稳定性；有效性确保了估计精度；一致性则保证了估计量在大样本情况下的可靠性。这三种标准共同构成了评价估计量优劣的基础框架。无偏性如何计算估计量的无偏性？步骤计算估计量的无偏性需要通过数学期望来判断。具体步骤如下：定义无偏估计量：首先，我们需要明确什么是无偏估计量。为了确保估计量的一致性，可以采用以下步骤：选择合适的估计量：首先，需要选择一个无偏且有效的估计量。无偏性意味着估计量的期望值等于待估计的参数，即估计量的系统误差为零；有效性则指在所有无偏估计量中，具有最小方差的估计量被认为是最有效的。有效性是指对同一总体参数，如果有多个无偏估计量，那么方差最小的估计量更有效。有效性强调的是在所有无偏估计量中，波动（方差）最小的估计量更为理想。
1.6K10编辑于 2024-10-16
来自专栏生物信息与临床医学专栏
R语言入门之基本统计量
‍描述性统计量第一部分：使用R语言基本函数进行统计描述 R语言是为统计分析而生的，它提供了大量灵活而使用的统计功能，其中最基础的就是一些描述性统计量，主要包括求和、均值、最值、方差、标准差下面我们将在R语言中逐一学习一遍： # 基本统计量示例 ##创建相关变量 a <- c(1,2,3,NA,5) # 创建变量a b <- c("red", "white", "red", "blue", # 创建变量b c <- c(TRUE,TRUE,TRUE,FALSE,TRUE) # 创建变量c mydata <- data.frame(a,b,c) # 利用以创建的变量构建数据框 ##基本统计量计算第二部分：使用“psych”包进行统计描述上面的例子都是使用R语言基本函数进行统计描述，实际上R语言里面还有一个很强大的统计包---“psych“，这个R包一开始是计量心理学（Psychometric 在psych包中我们可以使用describe.by()函数直接获得数据的基本统计量，这里面有四个统计量trimmed（trimmed mean，切尾均值）、mad（median absolute deviation
1.4K50发布于 2020-08-06

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

Token计量与费用归因体系设计

Token 计量与费用归因体系的设计

matlab空间计量模型AIC和SC,空间计量模型

计量笔记｜异方差

【温习统计学】无偏估计量、相合估计量

微服务Token鉴权的7种方案

计量笔记｜拟合优度

ISLR_t统计量

算法基础-顺序统计量

因果推断常用计量方法

AQR最最最新 | 计量经济学应用投资失败的7个原因

关于F统计量的澄清

统计简单学_常用统计量

解析 Token to Token Vision Transformer

计量模型 | 前定变量#时间FE

因果推断常用计量方法

计量笔记｜简单线性回归

小米 token(token在哪里获取)

如何评价估计量的好坏

R语言入门之基本统计量

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Token计量与费用归因体系设计

Token 计量与费用归因体系的设计

matlab空间计量模型AIC和SC,空间计量模型

计量笔记 ｜ 异方差

【温习统计学】无偏估计量、相合估计量

微服务Token鉴权的7种方案

计量笔记 ｜ 拟合优度

ISLR_t统计量

算法基础-顺序统计量

因果推断常用计量方法

AQR最最最新 | 计量经济学应用投资失败的7个原因

关于F统计量的澄清

统计简单学_常用统计量

解析 Token to Token Vision Transformer

计量模型 | 前定变量#时间FE

因果推断常用计量方法

计量笔记 ｜ 简单线性回归

小米 token(token在哪里获取)

如何评价估计量的好坏

R语言入门之基本统计量

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

计量笔记｜异方差

计量笔记｜拟合优度

计量笔记｜简单线性回归