首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • Token计量与费用归因体系设计

    二、成本失控的根因分析根因一:计量颗粒度太粗传统IT成本计量以“实例”或“账号”为单位。但AI成本是以“Token”为单位的——每次调用消耗数百到数千Token,单价低、频次高、总量大。 没有精细化的Token计量,就无法回答“谁、什么时候、用什么模型、花了多少Token”。根因二:缺少多维度归因能力一个Token消耗背后涉及多个维度:哪个部门?市场部还是研发部?哪个项目? 一个业务上线不当,Token消耗可能在几小时内翻倍。如果成本可见性是“T+30天”,等发现问题时,预算已经超了。三、Token计量体系设计核心目标: 每一次模型调用,都能回答“花了多少Token”。 设计要点:要点一:统一计量口径不同模型的Token计价方式不同(有的按输入+输出分别计费,有的按总Token计费)。 计量系统需要:统一采集每次调用的输入Token数、输出Token数记录模型名称、调用时间、响应耗时保留原始请求和响应(用于审计和复盘)要点二:实时计量流采用流式计量架构:模型调用完成 → 异步写入计量队列计量消费者聚合数据

    30910编辑于 2026-05-12
  • Token 计量与费用归因体系的设计

    无法拆分到各业务线· 用量行为难预测:某个员工突然开始用 AI 批量处理数据,当月成本暴增,事后才发现· 模型价格不一致:GPT-4o 和 GPT-4o-mini 单价差 20 倍,但用户选择模型往往没有约束二、计量体系的设计 2.1 归因维度要做有意义的费用报告,至少需要以下几个归因维度:计量记录(每次 LLM 调用):{ 'timestamp': '2026-03-15T10:23:45Z', 'model': ' token 比,比值异常往往意味着 prompt 设计有问题四、降低成本的工程手段4.1 Prompt 压缩input token 是成本的大头。 合同漏洞率下降了多少,转化为潜在风险规避价值· 处理量提升:客服智能体上线后,单位时间处理的工单数量提升了多少背景参考 在我们接触的企业里,没有做成本归因体系的团队,AI 月均花费往往比预期高出 2- ZGI(zgi.cn)的费用管控模块提供了从计量、归因到预算预警的完整体系,支持按部门独立预算管理。

    75810编辑于 2026-03-26
  • 来自专栏全栈程序员必看

    matlab空间计量模型AIC和SC,空间计量模型

    第二列(value)是各个统计量的值,比如LM lag就是统计量等于0.238,服从自由度为1的卡方分部。下面的差不多。 第三列(Prob)应该是对应的P value。

    81940编辑于 2022-11-01
  • 来自专栏PyStaData

    计量笔记 | 异方差

    1.2 异方差的后果 存在异方差的情况下: 估计量无偏:用 OLS 估计所得参数估计量 仍具有无偏性,即 。 ---- 【问题】为什么 LM 统计量是 呢? 在大样本中, 与检验整个方程显著性的 F 统计量渐近等价。 计算 F 统计量或者 LM 统计量并计算 p 值。(前者使用 分布,后者使用 分布)。如果这个 p 值很小,即低于选定的显著性水平,那么就拒绝同方差性的原假设。 ),即在完成估计后所计算的后续统计量计量经济学导论(第五版)[M]. 北京: 中国人民大学出版社.

    7.8K20发布于 2021-03-05
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-3 感知机

    要如何求出权重向量呢?基本做法和回归时相同,将权重向量用作参数,创建更新表达式来更新参数。这就需要一个被称为感知机的模型。

    67310编辑于 2022-11-08
  • 来自专栏算法无遗策

    动画 | 什么是2-3树?

    2-3树正是一种绝对平衡的树,任意节点到它所有的叶子节点的深度都是相等的。 2-3树的数字代表一个节点有2到3个子树。它也满足二分搜索树的基本性质,但它不属于二分搜索树。 2-3树查找元素 2-3树的查找类似二分搜索树的查找,根据元素的大小来决定查找的方向。 动画:2-3树插入 2-3树删除元素 2-3树删除元素相对比较复杂,删除元素也和插入元素一样先进行命中查找,查找成功才进行删除操作。 2-3树为满二叉树时,删除叶子节点 2-3树满二叉树的情况下,删除叶子节点是比较简单的。 动画:2-3树删除 -----END---

    1.1K10发布于 2020-01-02
  • 来自专栏机器学习与统计学

    【温习统计学】无偏估计量、相合估计量

    无偏估计量,数学期望等于被估计的量的统计估计量。 设^θ(X1,X2,…,Xn)是θ的估计量,若E(^θ)=θ,对一切θ∈Θ,则称^θ为θ的无偏估计量,否则称为θ的有偏估计量。 估计量的一种大样本性质:当样本容量n充分大时,估计量可以以任意的精确程度逼近被估计参数的真值。设n=T (X1,X2,…,Xn)是未知参数θ∈Θ的估计量,其中Θ是θ的值域。

    6K30发布于 2019-04-10
  • 来自专栏我是攻城师

    什么是2-3

    2-3树 VS 二叉搜索树 同样的一组数据,在2-3树和二叉搜索树里面的对比如下: ? 可以看到2-3树的节点分布非常均匀,且叶子节点的高度一致,并且如果这里即使是AVL树,那么树的高度也比2-3树高,而高度的降低则可以提升增删改的效率。 2-3树的插入 为了保持平衡性,2-3树的插入如果破坏了平衡性,那么树本身会产生分裂和合并,然后调整结构以维持平衡性,这一点和AVL树为了保持平衡而产生的节点旋转的作用一样,2-3树的插入分裂有几种情况如下 2-3树的删除 2-3树节点的删除也会破坏平衡性,同样树本身也会产生分裂和合并,如下: ? 总结 本篇文章,主要介绍了2-3树相关的知识,2-3树,2-3-4树以及B树都不是二叉树,但与二叉树的大致特点是类似的,它们是一种平衡的多路查找树,节点的孩子个数可以允许多于2个,虽然高度降低了,但编码相对复杂

    2.4K20发布于 2019-04-28
  • 来自专栏PyStaData

    计量笔记 | 拟合优度

    (图片来源:古扎拉蒂《计量经济学精要》(第 4 版)) 如上图所示,将 的总变异(TSS)分解为两部分,可以被回归分解(ESS) + 未被回归分解(RSS)。 自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。通常为 。 比如,若存在两个变量 ,而 那么自由度为 1 。 计量经济学导论(第 5 版)[M]. 北京: 中国人民大学出版社. [2] 陈强, 2015. 计量经济学及 Stata 应用[M]. 经济计量学精要(第 4 版)[M]. 机械工业出版社. [4] 李·C·阿迪金斯, 卡特·希尔, 2015. 应用 Stata 学习计量经济学原理(第 4 版)[M]. 重庆:重庆大学出版社.

    6.8K30发布于 2021-04-13
  • 来自专栏刷题笔记

    2-3 链表拼接 (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/101050371 2-3 链表拼接 (20 分) 本题要求实现一个合并两个有序链表的简单函数

    73440发布于 2019-11-08
  • 来自专栏python3

    2-3 选项卡控件

    2-3 选项卡控件 u本节学习目标: n了解选项卡控件的基本属性 n掌握如何设置选项卡控件的属性 n掌握统计页面选项卡控件页面基本信息 n掌握选项卡控件的功能操作控制 2-3-1 简介 在 Windows 一般选项卡在Windows操作系统中的表现样式如图2-3所示。 ? 图2-3 图片框控件的属性及方法 2-3-2 选项卡控件的基本属性 图片框控件是使用频度最高的控件,主要用以显示窗体文本信息。 其基本的属性和方法定义如表2-3所示: 属性 说明 MultiLine 指定是否可以显示多行选项卡。如果可以显示多行选项卡,该值应为 True,否则为 False。 使用这个集合可以添加和删除TabPage对象 表2-3 选项卡控件的属性 2-3-3 选项卡控件实践操作 1.

    2.3K10发布于 2020-01-07
  • 来自专栏python3

    2-3 T-SQL函数

    2-3 T-SQL函数 学习系统函数、行集函数和Ranking函数;重点掌握字符串函数、日期时间函数和数学函数的使用参数以及使用技巧 重点掌握用户定义的标量函数以及自定义函数的执行方法 掌握用户定义的内嵌表值函数以及与用户定义的标量函数的主要区别 我们首先运行一段SQL查询:select tno,name , salary From teacher,查询后的基本结构如图2-3所示。我们看见,分别有三位教师的薪水是一样高的。 图2-3 薪酬排序基本情况 图2-4 row_number函数排序 图2-5 row_number另一使用 我们可以使用Row_number函数来实现查询表中指定范围的记录,一般将其应用到Web应用程序的分页功能上

    2.2K10发布于 2020-01-08
  • 来自专栏YoungGy

    ISLR_t统计量

    mean inference for comparing two independent means inference for comparing two paired means 回顾 之前讲了Z统计量 Z统计量的总体逻辑是:假设H0成立,建立群体均值的正态分布。正态分布的均值是总体均值,标准差是σ/n−−√\sigma /\sqrt{n},σ\sigma一般用ss估计。

    96850发布于 2018-01-02
  • 来自专栏DearXuan的博客文章

    算法基础-顺序统计量

    顺序统计量 将长度为 n 的数组升序排序后,则第 i 个位置的数字是该数组的第 i 小的量,称之为第 i 顺序统计量 数组最小值是第1个顺序统计量,最大值是第n个顺序统计量,中位数(又称下中位数)是第⌊ (n+1)/2⌋个顺序统计量 ⌊n⌋ 表示对 n 向下取整,⌈n⌉表示对 n 向上取整 最大值和最小值 若想要寻找n个数字里的最大值或最小值,只需要进行(n-1)次比较 int min = a[0]; i += 2; } cout << "min:" << min << endl; cout << "max:" << max << endl; } 第i顺序统计量 如果想要找到数组里的第 i 顺序统计量,也就是第 i 小的数字,通常的办法是把整个数组排序,然后直接取出对应位置的数字。

    1.1K60编辑于 2022-01-31
  • 来自专栏技术学习笔记

    因果推断常用计量方法

    干预效应(Treatment Effect):干预问题的基础是量化干预效应,常用的计量指标包括: (1). 因此直接对整体计量时,相关关系与因果关系是相悖的。使用相关关系刻画因果关系时,应该控制混淆变量(例如按年龄段分组),用来消除虚假的因果关系。 常用计量方法 随机对照试验 因果推断的一条黄金法则:随机对照试验(AB测试) 是确定因果关系最可靠的方法 [3]。 通常使用样本均值和样本方差构建统计量,判断两组数据的绝对差异是否显著。常见的假设检验方法,参数检验: Z检验、T检验、F检验;非参数检验: 卡方检验、二项检验等。 常用于计算复杂随机变量的方差、标准差等统计量,从而简化概率推断的计算过程。

    1.6K34编辑于 2025-02-09
  • 来自专栏机器学习入门

    算法原理系列:2-3查找树

    结构缘由 首先,搞清楚2-3查找树为什么会出来,它要解决什么样的问题?假设我们对它的基本已经有所了解了。先给它来个简单的定义: 2-3查找树: 一种保持有序结构的查找树。 而2-3树就是为了规避上述问题而设计发明出来的模型。现在请思考该如何设计它呢? 这里我们从BST遇到的实际问题出发,提出设计指标,再去思考利用些潜在的性质来构建2-3树。 这部分内容,没有什么理论根据,而是我自己尝试去抓些字典的性质来构建,而2-3树的诞生过程并非真的如此,所以仅供参考。 构建2-3树 字典的两个主要操作为:查找和插入。 我就不卖关子了,直接给出2-3树的其中一个基本定义: 一棵2-3查找树或为一颗空树,或由以下节点组成: 2-节点:含有一个键和两条链接,左链接指向的2-3树中的键都小于该节点,右链接指向的2-3树中的键都大于该节点 3-节点:含有两个键和三条链接,左链接指向的2-3树中的键都小于该节点,中链接指向的2-3树中的键都位于该节点的两个键之间,右链接指向的2-3树中的键都大于该节点。 !!!

    1.2K20发布于 2019-05-26
  • 来自专栏生物信息与临床医学专栏

    关于F统计量的澄清

    在往期推送中,米老鼠和大家介绍过评价弱工具变量偏倚的策略------孟德尔随机化之F统计量。 一般而言,当F 统计量大于经验值10时,我们认为工具变量法估计值的偏倚大约是观察性研究的10%,因此F大于10这个标准在孟德尔随机化研究中广为使用。然而,这样的盲目使用不见得是合理的。 从上表中我们不难看出,随着均分的子队列数目增加,观察性估计量比较稳定,2SLS和LIML的估计值和实际观察值越来越接近,但是每个子队列的平均F统计量在不断减少。 也即说明,等分的子队列数目越多,工具变量估计值越接近真实值,但这时候F统计量可能是比较小的。 从上表中我们不难看出单纯依靠F统计量大于10来判断弱工具变量偏倚是不可靠的,当然我们这里并不是否认F统计量的作用,在实际研究中,F统计量越大,确实偏倚会小,但不能拿F大于10作为“金标准”。

    3.2K21编辑于 2022-08-21
  • 来自专栏用户8955222的专栏

    计量模型 | 前定变量#时间FE

    最近在某年会的学术汇报上看到一篇DID实证论文,不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库,但却用于评估2017年实施的某项政策的政策效应。

    1.2K20发布于 2021-11-10
  • 来自专栏U3D技术分享

    《游戏引擎架构》阅读笔记-第2-3

    本系列博客为《游戏引擎架构》一书的阅读笔记,旨在精炼相关内容知识点,记录笔记,以及根据目前(2022年)的行业技术制作相关补充总结。 本书籍无硬性阅读门槛,但推荐拥有一定线性代数,高等数学以及编程基础,最好为制作过完整的小型游戏demo再来阅读。 本系列博客会记录知识点在书中出现的具体位置。并约定(Pa b),其中a为书籍中的页数,b为从上往下数的段落号,如有lastb字样则为从下往上数第b段。 本系列博客会约定用【】来区别本人所书写的与书中观点不一致或者未提及的观点,该部分观点受限于个人以及当前时代的视角

    1K10编辑于 2022-10-28
  • 来自专栏YoungGy

    统计简单学_常用统计量

    连续型数据特征 数据特征值的应用 经验法则 盒须图 连续型数据特征 集中趋势 平均数 中位数(群体η\eta,样本X̃ \tilde{X}) 众数 选择:当群体中有离群值时,使用中位数或者众数,

    92540发布于 2019-05-27
领券