首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • Token计量与费用归因体系设计

    二、成本失控的根因分析根因一:计量颗粒度太粗传统IT成本计量以“实例”或“账号”为单位。但AI成本是以“Token”为单位的——每次调用消耗数百到数千Token,单价低、频次高、总量大。 没有精细化的Token计量,就无法回答“谁、什么时候、用什么模型、花了多少Token”。根因二:缺少多维度归因能力一个Token消耗背后涉及多个维度:哪个部门?市场部还是研发部?哪个项目? 设计要点:要点一:统一计量口径不同模型的Token计价方式不同(有的按输入+输出分别计费,有的按总Token计费)。 计量系统需要:统一采集每次调用的输入Token数、输出Token数记录模型名称、调用时间、响应耗时保留原始请求和响应(用于审计和复盘)要点二:实时计量流采用流式计量架构:模型调用完成 → 异步写入计量队列计量消费者聚合数据 计量系统按标签维度聚合成本,生成多维度报表。归因查询示例(纯文本格式):查询1:市场部本月花了多少Token?查询2:按场景分布(客服 vs 文案 vs 代码)查询3:哪个用户调用最频繁?

    30110编辑于 2026-05-12
  • 来自专栏机器视觉那些事儿

    【测量篇】(4)2D测量(计量

    2 2D测量算子 create_metrology_model( : : : MetrologyHandle) 描述:创建一个计量模型 参数: MetrologyHandle:创建计量模型句柄 set_metrology_model_image_size (MetrologyHandle, Width, Height)* 确定计量线对象的参数LineRow1 := [155,155]LineColumn1 := [400,400]LineRow2 := 算法功能:测量钻石边缘的夹角*2. * (2)应用计量对象,得到测量结果* *显示初始化* *将当前测量对象与计量模型对齐* *应用计量对象模型* LineColumn2, Tolerance, 10, 1, 20, [], [], Index1) *---------------设置测量ROI,设置计量模型参考坐标系------------*

    3.1K20发布于 2019-07-28
  • Token 计量与费用归因体系的设计

    无法拆分到各业务线· 用量行为难预测:某个员工突然开始用 AI 批量处理数据,当月成本暴增,事后才发现· 模型价格不一致:GPT-4o 和 GPT-4o-mini 单价差 20 倍,但用户选择模型往往没有约束二、计量体系的设计 2.1 归因维度要做有意义的费用报告,至少需要以下几个归因维度:计量记录(每次 LLM 调用):{ 'timestamp': '2026-03-15T10:23:45Z', 'model': ' token 比,比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段4.1 Prompt 压缩input token 是成本的大头。 合同漏洞率下降了多少,转化为潜在风险规避价值· 处理量提升:客服智能体上线后,单位时间处理的工单数量提升了多少背景参考 在我们接触的企业里,没有做成本归因体系的团队,AI 月均花费往往比预期高出 2- 建立归因体系后,通常在 1-2 个月内就能识别出主要的成本浪费点。ZGI(zgi.cn)的费用管控模块提供了从计量、归因到预算预警的完整体系,支持按部门独立预算管理。

    75710编辑于 2026-03-26
  • 来自专栏机器学习与统计学

    计量经济学名词】2绝对残差

    所谓残差图,就是以因变量的观测值yj或自变量值x1j、x2j、…、xkj或因变量回归值等为横坐标,且以残差或其标准化数值为纵坐标所作出的散点图。

    1.4K30发布于 2019-04-10
  • 来自专栏全栈程序员必看

    matlab空间计量模型AIC和SC,空间计量模型

    第二列(value)是各个统计量的值,比如LM lag就是统计量等于0.238,服从自由度为1的卡方分部。下面的差不多。 第三列(Prob)应该是对应的P value。

    81840编辑于 2022-11-01
  • 来自专栏PyStaData

    计量笔记 | 异方差

    1.2 异方差的后果 存在异方差的情况下: 估计量无偏:用 OLS 估计所得参数估计量 仍具有无偏性,即 。 估计量非有效:存在异方差时, 不是 的有效估计;直接计算 有误 。 t 检验、F 检验失效。 2. ---- 【问题】为什么 LM 统计量是 呢? 在大样本中, 与检验整个方程显著性的 F 统计量渐近等价。 ---- * 2.BP 检验 estat hettest, iid rhs /* 其中: - “estat”指 post-estimation statistics(估计后统计量),即在完成估计后所计算的后续统计量 */ quietly reg lntc lnq lnql lnpk lnpf predict e1, residual gen e2 = e1^2 gen lne2 = log(e2) reg lne2

    7.8K20发布于 2021-03-05
  • 来自专栏Eliauk的小窝

    Sa-Token整合OAuth2

    Sa-Token整合OAuth2 开源地址 https://gitee.com/ZVerify/zverify-blog 为什么要整合OAuth2 有些时候我们自己写的网站注册过于繁琐需要每个用户花费时间去注册 写之前思考一下 我们先想一下我们在进行第三方登录的时候是怎样的一个步骤,首先第三方登录都需要遵守OAuth2的流程,这里我使用了授权码模式,对于其他三种授权模式请参考网络文章,因为我使用了授权码模式所以他的整体流程都是一样的 ,首先前端通过访问网站拿到授权的code,然后回调我们后端的接口,此时只有code是变化的所以只需要接收到code,然后获取access_token ,拿到access_token之后我们可以去获取第三方用户信息 (access_token).openId(data).loginType(LoginTypeEnum.GITEE.getType()).build(); } 拿到access_token封装到对象中 通过access_token获得用户信息 然后通过access_token去访问gitee提供的通过access_token拿到用户信息的接口 @Override public SocialUserInfoDTO

    3.5K30编辑于 2022-11-15
  • 来自专栏blackheart的专栏

    2.OAuth2授权(续) & JWT(JSON Web Token)

    1.1 撤销Token 在上篇[认证授权] 1.OAuth2授权 中介绍到了OAuth2可以帮我们解决第三方Client访问受保护资源的问题,但是只提供了如何获得access_token,并未说明怎么来撤销一个 关于这部分OAuth2单独定义了一个RFC7009 - OAuth 2.0 Token Revocation来解决撤销Token问题。 2 OAuth2 Token 撤销(RFC7009 - OAuth2 Token Revocation) 简单来说,这个协议规定了一个Authorization server提供一个怎样的API来供Client 3 OAuth2 Token 元数据(RFC7662 - OAuth2 Token Introspection) 简单的总结来说,这个规范是为OAuth2扩展了一个API接口(Introspection Token 元数据 这一小节中,OAuth2返回Token的元数据的JSON,以及OAuth2中的access_token对Client是不透明的字符串这件事,我们可以把access_token的元数据信息用

    2.1K50发布于 2018-01-19
  • 来自专栏机器学习与统计学

    【温习统计学】无偏估计量、相合估计量

    无偏估计量,数学期望等于被估计的量的统计估计量。 设^θ(X1,X2,…,Xn)是θ的估计量,若E(^θ)=θ,对一切θ∈Θ,则称^θ为θ的无偏估计量,否则称为θ的有偏估计量。 估计量的一种大样本性质:当样本容量n充分大时,估计量可以以任意的精确程度逼近被估计参数的真值。设n=T (X1,X2,…,Xn)是未知参数θ∈Θ的估计量,其中Θ是θ的值域。

    6K30发布于 2019-04-10
  • 来自专栏PyStaData

    计量笔记 | 拟合优度

    (图片来源:古扎拉蒂《计量经济学精要》(第 4 版)) 如上图所示,将 的总变异(TSS)分解为两部分,可以被回归分解(ESS) + 未被回归分解(RSS)。 自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。通常为 。 比如,若存在两个变量 ,而 那么自由度为 1 。 = yhat^2 gen y2 = price^2 egen yhat2_sum = total(yhat2) egen y2_sum = total(y2) gen r_r2_2 = yhat2_sum 计量经济学导论(第 5 版)[M]. 北京: 中国人民大学出版社. [2] 陈强, 2015. 计量经济学及 Stata 应用[M]. 经济计量学精要(第 4 版)[M]. 机械工业出版社. [4] 李·C·阿迪金斯, 卡特·希尔, 2015. 应用 Stata 学习计量经济学原理(第 4 版)[M]. 重庆:重庆大学出版社.

    6.8K30发布于 2021-04-13
  • 来自专栏码匠的流水账

    spring security oauth2之refresh token

    序 本文就来讲一讲spring security oauth2的refresh token方式 authorizedGrantTypes oauth2官方只有4种授权方式,不过spring security oauth2把refresh token也归为authorizedGrantTypes的一种,因此配置的时候只需要这样就把所有方式都支持了 @Configuration @EnableAuthorizationServer OAuth2ServerConfig extends AuthorizationServerConfigurerAdapter { @Override public void configure "password", "implicit") .scopes("all") .resourceIds("oauth2- ":"a78999d6-614a-45fe-be58-d5e0b6451bdb","token_type":"bearer","refresh_token":"bb2a0165-769d-43b0-a9a5

    4.3K20发布于 2018-09-17
  • 来自专栏YoungGy

    ISLR_t统计量

    mean inference for comparing two independent means inference for comparing two paired means 回顾 之前讲了Z统计量 Z统计量的总体逻辑是:假设H0成立,建立群体均值的正态分布。正态分布的均值是总体均值,标准差是σ/n−−√\sigma /\sqrt{n},σ\sigma一般用ss估计。

    96850发布于 2018-01-02
  • 来自专栏DearXuan的博客文章

    算法基础-顺序统计量

    顺序统计量 将长度为 n 的数组升序排序后,则第 i 个位置的数字是该数组的第 i 小的量,称之为第 i 顺序统计量 数组最小值是第1个顺序统计量,最大值是第n个顺序统计量,中位数(又称下中位数)是第⌊ (n+1)/2⌋个顺序统计量 ⌊n⌋ 表示对 n 向下取整,⌈n⌉表示对 n 向上取整 最大值和最小值 若想要寻找n个数字里的最大值或最小值,只需要进行(n-1)次比较 int min = a[0]; ,大的作为max,小的作为min,共比较(3n/2-1)次;如果长度为奇数,则min和max都取第一项,因此实际的比较次数应该是(3n/2-2)次,即最终比较次数应该是 通过理论我们得知了只要把数组中的数两两比较 } cout << "min:" << min << endl; cout << "max:" << max << endl; } 第i顺序统计量 如果想要找到数组里的第 i 顺序统计量,也就是第 i 小的数字,通常的办法是把整个数组排序,然后直接取出对应位置的数字。

    1.1K60编辑于 2022-01-31
  • 来自专栏技术学习笔记

    因果推断常用计量方法

    干预效应(Treatment Effect):干预问题的基础是量化干预效应,常用的计量指标包括: (1). 因此直接对整体计量时,相关关系与因果关系是相悖的。使用相关关系刻画因果关系时,应该控制混淆变量(例如按年龄段分组),用来消除虚假的因果关系。 常用计量方法 随机对照试验 因果推断的一条黄金法则:随机对照试验(AB测试) 是确定因果关系最可靠的方法 [3]。 通常使用样本均值和样本方差构建统计量,判断两组数据的绝对差异是否显著。常见的假设检验方法,参数检验: Z检验、T检验、F检验;非参数检验: 卡方检验、二项检验等。 常用于计算复杂随机变量的方差、标准差等统计量,从而简化概率推断的计算过程。

    1.6K34编辑于 2025-02-09
  • 来自专栏码匠的流水账

    spring security oauth2使用redis存储token

    序 本文就来讲述一下spring security oauth2使用redis来存储token的配置及在redis中的存储结构 maven <dependency> <groupId token, OAuth2Authentication authentication) { byte[] serializedAccessToken = serialize(token 排除refresh_token,主要key如下: auth_to_access:OAuth2Authentication相关信息加密后的值,value为string结构 这个主要是通过OAuth2Authentication 来获取OAuth2AccessToken auth:token值,value为string结构 这个主要用来获取token的OAuth2Authentication,用来获取相应的权限信息 client_id_to_access token值,value为string 这个主要是通过token值来获取OAuth2AccessToken uname_to_access:clientId:userId,value的结构是list 存储

    3.8K00发布于 2018-09-17
  • 来自专栏生物信息与临床医学专栏

    关于F统计量的澄清

    在往期推送中,米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。 一般而言,当F 统计量大于经验值10时,我们认为工具变量法估计值的偏倚大约是观察性研究的10%,因此F大于10这个标准在孟德尔随机化研究中广为使用。然而,这样的盲目使用不见得是合理的。 从上表中我们不难看出,随着均分的子队列数目增加,观察性估计量比较稳定,2SLS和LIML的估计值和实际观察值越来越接近,但是每个子队列的平均F统计量在不断减少。 也即说明,等分的子队列数目越多,工具变量估计值越接近真实值,但这时候F统计量可能是比较小的。 从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的,当然我们这里并不是否认F统计量的作用,在实际研究中,F统计量越大,确实偏倚会小,但不能拿F大于10作为“金标准”。

    3.2K21编辑于 2022-08-21
  • 来自专栏YoungGy

    统计简单学_常用统计量

    连续型数据特征 数据特征值的应用 经验法则 盒须图 连续型数据特征 集中趋势 平均数 中位数(群体η\eta,样本X̃ \tilde{X}) 众数 选择:当群体中有离群值时,使用中位数或者众数,

    92440发布于 2019-05-27
  • 来自专栏GiantPandaCV

    解析 Token to Token Vision Transformer

    最后看下T2T,通过Token to Token结构(下文会讲),它在浅层的时候也能建模出结构信息,同时也避免了极值的出现。 Token To Token结构 ? T2T结构 Vision Transformer是将二维图片展平成一维向量(也叫token),然后送入到Transoformer结构里。 而T2T为了捕捉局部信息,它将所有的token通过reshape操作,恢复成二维,然后利用一个unfold一个划窗操作,属于一个窗口的tokens,会连接成一个更长的token,然后送入到Transformer 整体架构 T2T架构如上图所示,先经过2次Tokens to Token操作,最后给token加入用于图像分类的cls token,并给上位置编码(position embedding),送入到Backbone 输出再次经过LayerNorm,最后设置一定比例的Dropout T2T Module class T2T_module(nn.Module): """ Tokens-to-Token

    8.1K10发布于 2021-03-11
  • 来自专栏用户8955222的专栏

    计量模型 | 前定变量#时间FE

    最近在某年会的学术汇报上看到一篇DID实证论文,不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库,但却用于评估2017年实施的某项政策的政策效应。 2 陈诗一, 张建鹏, 刘朝良. 环境规制、融资约束与企业污染减排——来自排污费标准调整的证据J. 金融研究, 2021, 495(9): 51-71.

    1.2K20发布于 2021-11-10
  • 来自专栏CodeGuide | 程序员编码指南

    QClaw干掉10亿Token,做出2个精致skills!

    但不深度玩,不干它几亿Token,就不能体验到花钱的快乐!好在呀,好在QClaw每天一个登录的账号,赠送4000万Token。换5个微信(还得家里人多),就是2亿Token! 先拿10亿Token,写2个Skills之后再说(先把腿接上)。——把你工作的方式,训练成技能,让AI懂你!接下来,小傅哥就分享下,用OpenClaw(QClaw)做的一些事。 2.龙虾社群地址:https://wx.zsxq.com/group/48885154455258说明:现在OpenClaw养虾社区就已经入住了很多小龙虾,欢迎一起来玩下。 经过仅2周的折腾,目前发布了xfg-ddd-skillsv2.2.1版本,可以满足DDD六边形架构设计和编码实现。 只要有Token就想让AI继续搞。软件工程交付,需要的不只是代码,还包括完整的理解代码,代码与产品PRD完全匹配,从而形成代码资产。

    1.6K160编辑于 2026-03-30
领券