根因二:缺少多维度归因能力一个Token消耗背后涉及多个维度:哪个部门?市场部还是研发部?哪个项目?A项目还是B项目?哪个场景?客服还是文案?哪个用户?张三还是李四? 要点三:计量数据分层存储热存储(最近7天):实时查询,用于监控和告警温存储(最近90天):日常报表和分析冷存储(90天以上):合规审计和长期趋势分析四、费用归因模型设计有了计量数据后,需要建立归因模型, 归因维度设计:归因标签的传递链路:业务系统发起调用时,在请求头中携带归因标签:AI网关接收请求,提取标签,与调用记录关联存储。计量系统按标签维度聚合成本,生成多维度报表。 归因查询示例(纯文本格式):查询1:市场部本月花了多少Token?查询2:按场景分布(客服 vs 文案 vs 代码)查询3:哪个用户调用最频繁?查询4:GPT-4 vs Claude,哪个性价比更高? 计量跑通后,再逐步增加归因标签。第二步:选一个业务线试点选一个业务场景(如内部智能客服),先跑通“计量→归因→报表”的闭环。验证效果后再横向推广。
:某个员工突然开始用 AI 批量处理数据,当月成本暴增,事后才发现· 模型价格不一致:GPT-4o 和 GPT-4o-mini 单价差 20 倍,但用户选择模型往往没有约束二、计量体系的设计2.1 归因维度要做有意义的费用报告 ,至少需要以下几个归因维度:计量记录(每次 LLM 调用):{ 'timestamp': '2026-03-15T10:23:45Z', 'model': 'gpt-4o', 'input_tokens ': 1240, 'output_tokens': 380, 'cost_usd': 0.0186, // 归因标识(由调用方传入) 'org_unit': 'dept_legal', ,返回预定义的错误· 动态调额:支持临时申请额度提升,走审批流后生效三、成本可视化报告应该包含什么一份有用的 AI 费用报告,不只是「花了多少钱」,而是帮助管理者做判断:· 按部门分布:哪个部门用得多 建立归因体系后,通常在 1-2 个月内就能识别出主要的成本浪费点。ZGI(zgi.cn)的费用管控模块提供了从计量、归因到预算预警的完整体系,支持按部门独立预算管理。
渠道归因(一)传统渠道归因 小P:小H,我又来了。。。最近在做ROI数据,但是有个问题。。。 小H:什么问题,不就是收入/成本吗? 小P:是的,每个渠道的成本很容易计算,但是收入就有点问题了。 小P:不愧是你,对的,用户在付费前经历过很多渠道,我感觉把收入分给谁都不好说 小H:这个也不复杂,关于渠道归因的方式有很多种,比如传统渠道归因、基于马尔可夫链、基于shapley value甚至是基于Attention-RNN 说到渠道归因,那最容易想到的就是传统的渠道归因,这种方法一般是基于业务决策的。 首次归因:首次点击渠道赋予全部转化 末次归因:末次点击渠道赋予全部转化 线性(平均)归因:每个渠道均分转化 位置归因:自定义位置的权重,一般首位占50%,其余为0 时间衰减归因:距离转化的时间越短的渠道 实际上,传统的渠道归因是易于理解、好操作、结果接受程度高的~ 共勉~
渠道归因(三)基于Shapley Value的渠道归因 通过Shapley Value可以计算每个渠道的贡献权重,而且沙普利值的计算只需要参加的渠道总数,不考虑顺序,因此计算成本也较低。 pd import matplotlib.pyplot as plt import seaborn as sns 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 总结 日常业务中,可以结合多个方法看一下归因的差异。
文章目录 1 归因分析 2 传统归因分析方法 2.1 传统归因分析 2.2.1 最终互动归因模型 2.2.2 最终非直接点击归因模型 2.2.3 最终AD点击归因 2.2.4首次互动归因 2.2.5 线性归因模型 2.2.6 时间衰减归因模型 2.2.7 位置归因模型 2.2.8 自定义归因模型 2.2.9 马尔科夫归因模型 2.2 不同归因方法的使用场景 3 算法归因的几种方法 3.1 夏普里值 5.2 GA中的多渠道归因 5.3 有效触点归因 参考文献 本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖 来做归因建模(附代码demo)(五) 1 归因分析 什么是广告归因(Attribution)? 2 传统归因分析方法 2.1 传统归因分析 参考自文章[1][2][3] 还有文章:【数据分析思维】多因素影响下如何归因? GA里面的归因模型有非常多种,分为单触点归因和多触点归因。
解释 这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开app都回传给渠道商,渠道商自己归因 有的如华为是从应用商店安装时, 应用商店把归因信息写入到 app, 然后首次安装启动时能从本地存储获取到归因数据 曝光归因 曝光归因由于有数据量极大、不会使用此项 点击归因(常用) 所谓点击归因, 就是点击广告之后首个转化, 基本都是用这种方式归因 归因模型 末次归因模型 (常用, 因为比较好实现) 多个归因源事件时,认为最后一个归因源事件的功劳为100%。 首次归因模型 多个归因源事件时,认为第一个归因源事件的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。 平均归因模型 多个归因源事件时,认为每个归因源事件平均分配此次功劳。 时间衰减归因模型 加上了时间的影响因素,最后1次触达的贡献更高。 位置归因模型 多个归因源事件时,认为第一个归因源事件和最后一个归因源事件各占40%功劳,其余平分剩余的20%功劳。
渠道归因(二)基于马尔可夫链的渠道归因 在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。 本文主要参考自python实现马尔可夫链归因[1]。 马尔可夫链是一个过程,它映射运动并给出概率分布,从一个状态转移到另一个状态。 所以马尔可夫链模型可以用来做归因分析。 pandas as pd from markovattribution import MarkovAttribution 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 共勉~ 参考资料 [1] python实现马尔可夫链归因: https://mattzheng.blog.csdn.net/article/details/117296062
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 所以马尔可夫链模型可以用来做归因分析。 由于大多数渠道是有偿的(根据金钱或花费的时间),因此至关重要的是,有一种算法可以在这些渠道之间分配转化次数和价值,并与它们的费用进行比较,而不是将其记入仅最后一个非直接渠道。 : 20.5 + 10.25 + 4 * 0.33 + 3 *0.5 = 4.07 100个人的总费用为:100*4.07 = 407元 3.5 markov-chain-attribution代码
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 由于非Facebook的广告使用的是第三方归因平台如AppFlyer、Adjust或者Kochava,他们并没有Facebook的归因数据,所以双方是独立的归因系统和归因逻辑,也就是会存在多次计费的可能 首先,广告主做用户增长的团队需要有懂广告归因的人,况且即便懂了这套归因逻辑,也很难区分有效触点归因“抢”了多少自然量。 由于当年在东南亚归因作弊异常猖獗(具体作弊手段可以参考我的另一篇文章《不懂归因,也许你广告还没入门》),很多联盟的流量通过虚拟点击抢归因,抢了这两个广告主很多的“自然量”。 这个事情也从另外一个侧面推动了第三方归因服务公司加强归因作弊识别的能力。
今天,我们将列举一些常用的归因模型,并演示如何使用Googel Analytics 归因模型对比工具来为你的业务挑选最适合的模型。 归因模型应用示例 假设你的网站售卖烧烤架。 Google Analytics 归因模型101 在末次互动归因模型中,我们将转化的全部功劳归于用户的最后一个触点。 末次非直接点击归因模型忽视了直接流量,把转化功劳全归因于在完成销售之前的最后一次渠道点击。 我们再来看更多模型: 与末次互动相似,首次互动归因模型把转化功劳全归因于首次触点——在Grillmaster先生的例子中,即为自然搜索。 线性归因模型在各个渠道之间平均分配成功转化分数。 Google Analytics的归因模型 Google Analytics 的大多数标准报告使用的是末次非直接点击归因模型,但是现在我们可以通过对比归因模型,来决定使用为用户生命周期带来最高价值的模型
不管是做FOF也好,仅仅想单纯归因也好,Brison是一种比较常见,也算是通用的归因方法,其一般用于权益类或者大类资产配置类基金。 其实Brison归因的逻辑很简单,假设有一个基准,基准在各类资产的配置上的权重分别是wbi(weight of benchmark of asset i),这些资产的收益率分别是rbi(return of benchmark of asset i),同样的,我们有一个需要归因的基金产品,也就是我们自己的组合,在各类资产上的权重是wpi(weight of portfolio of asset i),收益率分别是 所谓的Brison归因就是把一个组合的超额收益分解为资产配置的能力、个券选择的能力、以及交互收益。
让我们来看看每一个普及的模型,看看每一步骤的归因。这样我们就可以权衡利弊。 最后点击(Last-Click) ? 这归因模型功劳于转化前的最后一个通道,这就是我们以上举例的重定向广告。 这类归因模型允许你创建混合型最后单击和初次点击的模型,并给每个触达点相应的百分比。 优点:如果你的营销项目主旨是保持与用户的关系和认知,那么线性的归因就比较有用。比如说,如果你有一个品牌的广告项目,每一个媒介点在用户考虑阶段都同等重要,那么线性的归因能够帮助你您可视化这一进程。 缺点:时间衰减归因对最后转化有贡献,但是是初始的触达的渠道有打折扣,例如Facebook或者最初的搜索会话。 自定义(Custom ) ? 这就是“圣杯”归因模型! 你需要对其他模型非常了解再来运用自定义归因模型 正如你所看到的,这里有很多归因模型,找到一个适合你的业务的模型途径需要测试并且优化。使用一些虚拟数据集来测试不同的广告项目和媒介渠道。
本文将深入探讨LTA的局限性,分析其归因陷阱,并提出突破路径,帮助广告主从“流量思维”跃迁至“价值思维”。 二、LTA的三大归因陷阱:为何“最后一击”无法定义全部价值? 1. 三、突破LTA:从“单点归因”到“全局视角”的进化 1. 在GDPR、CCPA等法规日益严格的背景下,MMM成为符合合规要求的归因工具。 非显性渠道覆盖:有效评估线下广告、电视媒体等传统归因模型难以衡量的渠道价值。 多触点归因模型:平衡短期与长期价值 除MMM外,品牌还可结合其他多触点归因模型(如线性归因、时间衰减模型)优化策略: 线性归因:平均分配各触点的贡献值,适合强调全链路体验的品牌(如奢侈品)。 通过多触点归因,品牌发现LinkedIn广告对线索生成的贡献率为40%,并据此优化广告预算分配。 七、技术实现:构建多触点归因模型 1.
我们至少需要投入的硬件成本,就 T 是一次性硬盘购买费用加上维护费用,即 33 + 9.2 = 42W 元。 根据硬盘推算服务器投入 接下来,我们还需要计算服务器的相关成本。 根据服务器托管推算维护费用 把 2u 服务器托管在较好的机房里, 每台服务器托管的费用每年大概是 1W 元。前面我们算过服务器需要 12 台,那么一年的托管费用就是 12W 元。 现在我们来算算第一年的投入是多少,这个投入包括硬盘的投入及维护费用、服务器的硬件费用和托管费用,以及宽带费用。 计算公式如下: 第一年投入费用 = 42W(硬盘新购与备用盘)+ 36W(服务器一次性投入)+ 12W(服务器托管费)+ 10W(宽带费用)= 100W 元 而后续每年维护费用,包括硬盘替换费用(假设都用完 )、服务器的维护费用和宽带费用。
指标的异常归因是数据分析师日常工作中遇到的最高频问题之一。 关于异常归因的核心问题其实就两个:一个是从哪些维度进行指标拆解,另一个是各个维度之间的贡献度分别是多少? 我们在实际工作场景中就完全可以利用ChatGPT来提高日常归因的效率。
基于此,就有了线上全域归因、线上局部归因。 线上局部归因,我们目前的技术手段所实现的基本都是指的是线上的局部归因,是忽略了我们所不能掌握的因素的一种归因分析手段。 通过分析每个归因模型,我们可以更好地了解每个营销渠道的投资回报率。不一定有“最佳”归因模型,但我们可以选择一种作为报告和分析的主要归因模型。 - 最终互动归因 ? 线性归因对所有事物都给予同等的重视。该模型不会突出显示最有效的策略。如果您想要一个简单明了的归因模型,并且可以轻松地向客户解释,那么线性归因可能是您的理想选择。 - 时间衰减归因 ? 通过归因,您可以了解整个客户旅程中不同的互动如何影响转化。传统归因归因于特定事件和任意事件,而最佳归因则使用机器学习和高级统计模型来了解每次触摸的精确影响。 归因除了基于规则的实现,还有机器学习的实现方式,称为算法归因。 归因也可以从辛普森悖论里获得结论。
在数字营销领域,“归因”从来不只是一个技术问题,而是一个如何理解用户决策过程的问题。随着媒介环境、数据能力和用户识别方式的变化,归因模型也经历了明显的阶段性演进。 从整体上看,这条演进路径可以概括为三个阶段: 阶段 1:基于规则的归因(Rule-based Attribution) 阶段 2:基于算法的归因(Data-Driven Attribution, DDA ) 阶段 3:基于用户的归因(People-Based Attribution) 这三个阶段,并不是简单的“新旧替代”,而是对归因视角的一次次升级:从规则 → 数据 → 用户身份。 、结果可解释 常见的规则归因模型包括:: 模型 归因逻辑 最后一次点击(Last Click) 转化归功于最后一个触点 第一次点击(First Click) 转化归功于第一个触点 线性归因 所有触点平均分配 时间衰减 越接近转化,权重越高 位置归因 首次与最后一次权重更高 延伸阅读:Web端广告归因模型全解析:从单触点到多触点归因 这一阶段的归因模型,适用于: 渠道数量有限 用户路径较短 Cookie/
费用报销操作包括: 在资金计划内付款,如之前有预付过货款,则进行 预付应付清账; 在资金计划内付款,如之前没有预付过货款,则根据需要支付的金额和明细进行应付清账。 费用报销用于冲销之前的员工借款,进行清账,冲销个人借款(F-30) 步骤1:输入待清账相关信息 ? 步骤2:输入清账金额和起息日 ? 步骤3:输入原因代码 ?
之前几篇多渠道归因分析应该算是比较通用的一些方法论: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因(三 ) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五) 1.1 与markov、Sharpley 的差异 1.2 注意力的循环神经网络多点触摸归因模型框架 1.3 LSTM 来捕捉长路径模式 1.4 RNN with Attention 将时间衰减作为attention 案例代码demo解读 3.1 数据样式 3.2 训练与预测 3.3 确定最优影响力的路径 3.4 确定attention weight 4 后续YY 参考文献 1 基于注意力的循环神经网络多点触摸归因模型 (markov考虑了顺序) 未融入用户属性信息 1.2 注意力的循环神经网络多点触摸归因模型框架 一种基于注意力的循环神经网络多点触摸归因模型,以监督学习的方式预测一系列事件是否导致转换(购买)。
本文将介绍从用户视角出发的白屏检测方案以及线上白屏问题的大致归因思路。 ,但是像弱网这类环境问题想要精准归因势必要划分一个相对严格的阈值,这就会存在有些和阈值非常相近的弱网问题没有被归为弱网,那么这类问题就只能按照耗时异常的阶段来归因,例如DNS长耗时,TCP建连长耗时等。 如果一个日志不符合任意一种环境问题,那么就需要对白屏中的所有图片单独做归因,最后再取占比最高的问题类型作为整体的白屏归因。 归因策略特殊异常问题OCSP问题(网络篇有介绍),解码异常,证书校验异常此类问题都伴有特殊的基础库异常,可以直接归因,不像CDN节点异常和弱网之间存在着重叠部分,还需要现场信息佐证。 这也证明了该策略对脏数据归因的准确性。归因优先级我们目前问题归因的优先级从高到低如下,主要按归因证据的可信度来排序。