首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • Token计量与费用归因体系设计

    二、成本失控的根因分析根因一:计量颗粒度太粗传统IT成本计量以“实例”或“账号”为单位。但AI成本是以“Token”为单位的——每次调用消耗数百到数千Token,单价低、频次高、总量大。 没有精细化的Token计量,就无法回答“谁、什么时候、用什么模型、花了多少Token”。根因二:缺少多维度归因能力一个Token消耗背后涉及多个维度:哪个部门?市场部还是研发部?哪个项目? 设计要点:要点一:统一计量口径不同模型的Token计价方式不同(有的按输入+输出分别计费,有的按总Token计费)。 计量系统需要:统一采集每次调用的输入Token数、输出Token数记录模型名称、调用时间、响应耗时保留原始请求和响应(用于审计和复盘)要点二:实时计量流采用流式计量架构:模型调用完成 → 异步写入计量队列计量消费者聚合数据 计量系统按标签维度聚合成本,生成多维度报表。归因查询示例(纯文本格式):查询1:市场部本月花了多少Token?查询2:按场景分布(客服 vs 文案 vs 代码)查询3:哪个用户调用最频繁?

    30410编辑于 2026-05-12
  • 来自专栏机器学习与统计学

    【R语言经典实例3】计算基本统计量

    问题 如何使用R软件计算下列统计量:均值、中位数、标准差、方差、协方差和相关系数。 R软件中,用简单的函数便能完成标准差和其他基本统计量的计算。 一般来说,函数参数是一个数值向量,而函数返回计算出的统计量: > x <- c(0,1,1,2,3,5,8,13,21,34) > mean(x) [1] 8.8 > median(x) [1] 4 > cor函数以及cov函数分别计算两变量间的相关系数与协方差: > x <- c(0,1,1,2,3,5,8,13,21,34) > y <- log(x+1) > cor(x,y) [1] 0.9068053 某个变量中的一个缺失值就有可能导致函数返回NA结果,甚至可能造成计算机在计算过程中报错: > x <- c(0,1,1,2,3,NA) > mean(x) [1] NA > sd(x) [1] NA 虽然

    2.4K20发布于 2019-04-10
  • Token 计量与费用归因体系的设计

    大模型调用的成本有几个特殊性:· 按量计费,弹性大:一个写得差的 prompt 可能比写得好的多用 3token,成本差异完全不透明· 多项目共用 Key:研发、运营、客服都在用同一套 API 2.1 归因维度要做有意义的费用报告,至少需要以下几个归因维度:计量记录(每次 LLM 调用):{ 'timestamp': '2026-03-15T10:23:45Z', 'model': ' token 比,比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段4.1 Prompt 压缩input token 是成本的大头。 合同漏洞率下降了多少,转化为潜在风险规避价值· 处理量提升:客服智能体上线后,单位时间处理的工单数量提升了多少背景参考 在我们接触的企业里,没有做成本归因体系的团队,AI 月均花费往往比预期高出 2-3 ZGI(zgi.cn)的费用管控模块提供了从计量、归因到预算预警的完整体系,支持按部门独立预算管理。

    75810编辑于 2026-03-26
  • 来自专栏全栈程序员必看

    matlab空间计量模型AIC和SC,空间计量模型

    第二列(value)是各个统计量的值,比如LM lag就是统计量等于0.238,服从自由度为1的卡方分部。下面的差不多。 第三列(Prob)应该是对应的P value。

    81940编辑于 2022-11-01
  • 来自专栏PyStaData

    计量笔记 | 异方差

    ---- 【问题】为什么 LM 统计量是 呢? 在大样本中, 与检验整个方程显著性的 F 统计量渐近等价。 * 3.怀特检验 estat imtest, white // imtest: information matrix test(信息矩阵检验) 3. 假设已把 ${\hat \sigma_{i}^2}_{i=1}^n$ 存储在变量 var 上,可通过如下 Stata 命令来实现 WLS : */ reg y x1 x2 x3 [aw=1/var] */ * 3.怀特检验 estat imtest, white // imtest:information matrix test(信息矩阵检验) /*结果解读: p值(Prob>chi2)等于 0.0000 假设已把 ${\hat \sigma_{i}^2}_{i=1}^n$ 存储在变量 var 上,可通过如下 Stata 命令来实现 WLS : reg y x1 x2 x3 [aw=1/var] 其中,“

    7.8K20发布于 2021-03-05
  • 来自专栏机器学习与统计学

    【温习统计学】无偏估计量、相合估计量

    无偏估计量,数学期望等于被估计的量的统计估计量。 设^θ(X1,X2,…,Xn)是θ的估计量,若E(^θ)=θ,对一切θ∈Θ,则称^θ为θ的无偏估计量,否则称为θ的有偏估计量。 估计量的一种大样本性质:当样本容量n充分大时,估计量可以以任意的精确程度逼近被估计参数的真值。设n=T (X1,X2,…,Xn)是未知参数θ∈Θ的估计量,其中Θ是θ的值域。

    6K30发布于 2019-04-10
  • 来自专栏机器学习与统计学

    计量经济学名词】3协方差分析

    协方差分析(analysis of covariance)是关于如何调节协变量对因变量的影响效应,从而更加有效地分析实验处理效应的一种统计技术,也是对实验进行统计控制的一种综合方差分析和回归分析的方法。

    1.7K30发布于 2019-04-10
  • 来自专栏PyStaData

    计量笔记 | 拟合优度

    (图片来源:古扎拉蒂《计量经济学精要》(第 4 版)) 如上图所示,将 的总变异(TSS)分解为两部分,可以被回归分解(ESS) + 未被回归分解(RSS)。 自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。通常为 。 比如,若存在两个变量 ,而 那么自由度为 1 。 计量经济学导论(第 5 版)[M]. 北京: 中国人民大学出版社. [2] 陈强, 2015. 计量经济学及 Stata 应用[M]. 高等教育出版社. [3] 达莫道尔·N·古扎拉蒂, 道恩·C·波特, 2010. 经济计量学精要(第 4 版)[M]. 机械工业出版社. [4] 李·C·阿迪金斯, 卡特·希尔, 2015. 应用 Stata 学习计量经济学原理(第 4 版)[M]. 重庆:重庆大学出版社.

    6.8K30发布于 2021-04-13
  • 来自专栏YoungGy

    ISLR_t统计量

    mean inference for comparing two independent means inference for comparing two paired means 回顾 之前讲了Z统计量 Z统计量的总体逻辑是:假设H0成立,建立群体均值的正态分布。正态分布的均值是总体均值,标准差是σ/n−−√\sigma /\sqrt{n},σ\sigma一般用ss估计。

    96850发布于 2018-01-02
  • 来自专栏DearXuan的博客文章

    算法基础-顺序统计量

    顺序统计量 将长度为 n 的数组升序排序后,则第 i 个位置的数字是该数组的第 i 小的量,称之为第 i 顺序统计量 数组最小值是第1个顺序统计量,最大值是第n个顺序统计量,中位数(又称下中位数)是第⌊ n)取到最小值,即k1=2 得到上述结果的前提是事先定义好了min和max的初值,但是实际应用中我们可以根据数组动态调整初值,如果长度为偶数,则先比较前两项,大的作为max,小的作为min,共比较(3n = a[1]; }else{ min = a[1]; max = a[0]; } //从a[2]和a[3] 开始比较,i为3 i = 3; }else{ //当长度为基数时,将最大值和最小值都设为a[0] min = max = a[0]; 如果想要找到数组里的第 i 顺序统计量,也就是第 i 小的数字,通常的办法是把整个数组排序,然后直接取出对应位置的数字。

    1.1K60编辑于 2022-01-31
  • 来自专栏技术学习笔记

    因果推断常用计量方法

    观测结果Y_i = Y_i(0) + [Y_i(1) - Y_i(0)] \times D_i 3. 干预效应(Treatment Effect):干预问题的基础是量化干预效应,常用的计量指标包括: (1). 因此直接对整体计量时,相关关系与因果关系是相悖的。使用相关关系刻画因果关系时,应该控制混淆变量(例如按年龄段分组),用来消除虚假的因果关系。 常用计量方法 随机对照试验 因果推断的一条黄金法则:随机对照试验(AB测试) 是确定因果关系最可靠的方法 [3]。 常用于计算复杂随机变量的方差、标准差等统计量,从而简化概率推断的计算过程。

    1.6K34编辑于 2025-02-09
  • 来自专栏接口自动化测试平台

    SpringBoot结合Sa-token实现权限认证(3

    -- Sa-Token 权限认证,在线文档:https://sa-token.cc --><dependency> <groupId>cn.dev33</groupId> <artifactId >sa-token-spring-boot-starter</artifactId> <version>1.34.0</version></dependency>2、然后配置sa-token相关的参数 :sa-token: # token名称 (同时也是cookie名称) token-name: token # token有效期,单位s 默认30天, -1代表永不过期 timeout false时每次登录新建一个token) is-share: true # token风格 token-style: uuid # 是否输出操作日志 is-log: true3 、Sa-Token 提供了扩展接口可以把token和session信息存储在Redis中,这里就按照文档集成进来,引入依赖<!

    2.6K80编辑于 2023-05-17
  • 来自专栏生物信息与临床医学专栏

    关于F统计量的澄清

    在往期推送中,米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。 从上表中我们不难看出,随着均分的子队列数目增加,观察性估计量比较稳定,2SLS和LIML的估计值和实际观察值越来越接近,但是每个子队列的平均F统计量在不断减少。 也即说明,等分的子队列数目越多,工具变量估计值越接近真实值,但这时候F统计量可能是比较小的。 从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的,当然我们这里并不是否认F统计量的作用,在实际研究中,F统计量越大,确实偏倚会小,但不能拿F大于10作为“金标准”。 IntJ Epidemiol. 2011 Jun;40(3):755-64. doi: 10.1093/ije/dyr036. Epub 2011 Mar 16.PMID: 21414999.

    3.2K21编辑于 2022-08-21
  • 来自专栏YoungGy

    统计简单学_常用统计量

    连续型数据特征 数据特征值的应用 经验法则 盒须图 连续型数据特征 集中趋势 平均数 中位数(群体η\eta,样本X̃ \tilde{X}) 众数 选择:当群体中有离群值时,使用中位数或者众数,

    92540发布于 2019-05-27
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    3), stride=(2, 2), padding=(1, 1)) self.soft_split2 = nn.Unfold(kernel_size=(3, 3), stride * 3 * 3, in_dim=token_dim, num_heads=1, mlp_ratio=1.0) self.project = nn.Linear(token_dim * 3 * 3, embed_dim) elif tokens_type == 'performer': ... transpose(1, 2) # final tokens x = self.project(x) return x 首先设置三个划窗大小分别为7x7, 3x3 , 3x3的Unfold操作,和两个Token Transformer模块。

    8.1K10发布于 2021-03-11
  • 来自专栏用户8955222的专栏

    计量模型 | 前定变量#时间FE

    最近在某年会的学术汇报上看到一篇DID实证论文,不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库,但却用于评估2017年实施的某项政策的政策效应。

    1.2K20发布于 2021-11-10
  • 来自专栏PyStaData

    计量笔记 | 简单线性回归

    * PRF 和 SRF:蒙特卡罗模拟 clear set obs 30 set seed 10101 gen x = rnormal(3, 4) gen e = rnormal(0, 9) gen y 2^2)$,扰动项 $\epsilon_i ~ N(0,3^2)$,样本容量为 30 。 */ clear set obs 30 set seed 10101 gen x = rnormal(3, 4) gen e = rnormal(0, 9) gen y = 1*x + e reg 计量经济学及 Stata 应用[M]. 高等教育出版社. 古扎拉蒂, 波特, 2010. 经济计量学精要[M]. 机械工业出版社. 杰弗里·M·伍德里奇, 2015. 计量经济学导论(第五版)[M]. 北京: 中国人民大学出版社.

    4.7K42发布于 2021-03-05
  • 因果推断常用计量方法

    模型:���=�0+�1Treatment�+�2Post�+�3(Treatment�×Post�)+���Yit​=β0​+β1​Treatmenti​+β2​Postt​+β3​(Treatmenti​ ×Postt​)+ϵit​其中,�3β3​ 是处理效应。 3. 回归不连续设计 (Regression Discontinuity Design, RDD)原理:利用某个变量(如考试分数、收入水平)的阈值来划分处理组和对照组,假设在阈值附近个体特征相似。

    81810编辑于 2025-02-21
  • 来自专栏从零开始学自动化测试

    httprunner学习3-extract提取token值参数关联

    前言 如何将上个接口的返回token,传给下个接口当做请求参数?这是最常见的一个问题了。 解决这个问题其实很简单,我们只需取出token值,设置为一个中间变量a,下个接口传这个变量a就可以了。 那么接下来就是解决两个问题: 如何取出token值? 如何参数关联? 场景案例 我现在有一个登陆接口A,登陆成功后返回一个token值。 参数:Authorization: Token xxxxx login token xxxxx 先不带token去访问接口B,使用命令行工具httpie测试接口 C:\Users\dell>http http 提取登录接口返回的token值,使用extract提取器 extract: - token: content.token 下个接口的用例引用token参数使用$token,完整的用例test_info.yml $token # 引用token validate: - eq: [status_code, 200] - eq: [headers.Content-Type, application

    2.1K40发布于 2019-09-24
  • 来自专栏全栈程序员必看

    小米 token(token在哪里获取)

    小米设备token获取&HomeAssistant安装部署 小米智能设备token获取 miIO-discovery获取token与控制 app直接token获取 DB获取token 开源智能家居平台HomeAssistant 该库需要安装在Python3.5以上版本,首先搭建Python环境: 安装Python3.5依赖(本机存在的会忽略) sudo apt-get install build-essential libsqlite3- dev sqlite3 bzip2 libbz2-dev libssl-dev openssl libgdbm-dev liblzma-dev libreadline-dev libncursesw5- DB获取token  第1步,获取一部安卓手机的root权限  第2步,安装米家app并登录账号  第3步,进入/data/data/com.xiaomi.smarthome/databases 有开源或开放的各种智能软件(人脸识别、车牌识别文字识别、文字转语音、语音转文字等)、有各种联动机制(短信、Email等) 安装部署HomeAssistant 安装HomeAssistant pip3

    10.7K10编辑于 2022-07-29
领券