让我们来看看每一个普及的模型,看看每一步骤的归因。这样我们就可以权衡利弊。 最后点击(Last-Click) ? 这归因模型功劳于转化前的最后一个通道,这就是我们以上举例的重定向广告。 这类归因模型允许你创建混合型最后单击和初次点击的模型,并给每个触达点相应的百分比。 优点:如果你的营销项目主旨是保持与用户的关系和认知,那么线性的归因就比较有用。比如说,如果你有一个品牌的广告项目,每一个媒介点在用户考虑阶段都同等重要,那么线性的归因能够帮助你您可视化这一进程。 缺点:时间衰减归因对最后转化有贡献,但是是初始的触达的渠道有打折扣,例如Facebook或者最初的搜索会话。 自定义(Custom ) ? 这就是“圣杯”归因模型! 你需要对其他模型非常了解再来运用自定义归因模型 正如你所看到的,这里有很多归因模型,找到一个适合你的业务的模型途径需要测试并且优化。使用一些虚拟数据集来测试不同的广告项目和媒介渠道。
归因的比较 4 归因分析的服务商 1 zoho CRM —— 营销归因 2 Google Attribution 360使用 3 VisualIQ 4 Convertro 5 归因分析的一些案例 2 传统归因分析方法 2.1 传统归因分析 参考自文章[1][2][3] 还有文章:【数据分析思维】多因素影响下如何归因? GA里面的归因模型有非常多种,分为单触点归因和多触点归因。 等等… 3 算法归因的几种方法 参考:互联网广告的归因分析(Attribution Analysis) 数据驱动归因的几个算法 之前看到的传统归因,大多基于规则; 数据驱动归因(Data-Driven 我们如何用这个方法来分析不同渠道的贡献度呢? 下面是一个例子, 假设有3个渠道:信息流(A),开屏(B),视频前贴©,他们的独自投放效果和两两投放效果如下图所标识。 参考文献 1 互联网广告的归因分析(Attribution Analysis) 2 2.3、流量的高级分析与流量渠道的协同:归因和归分析型 3 【科普】深度解析亚马逊广告归因(含案例解析) 4 【数据分析思维
今天,我们将列举一些常用的归因模型,并演示如何使用Googel Analytics 归因模型对比工具来为你的业务挑选最适合的模型。 归因模型应用示例 假设你的网站售卖烧烤架。 末次非直接点击归因模型忽视了直接流量,把转化功劳全归因于在完成销售之前的最后一次渠道点击。 模型对比工具一次最多能对比3种模型。添加二次维度,例如来源/媒介,可以更加深入挖掘转化的路径。例如,添加二次维度来源,把自然搜索细分为Google, Bing 和Yahoo. 相反,他们帮助我们分析并且找出多触点间所有行为数据的意义,因此我们能做出基于数据的判断。 在我们的实际工作中,可以经常尝试多种归因模型,对比分析归因模型对多渠道效果转化的效果,选择适合自己公司业务的最优模型。
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 所以马尔可夫链模型可以用来做归因分析。 这是一个多渠道归因模型问题。 Google Analytics(分析)的定义有助于:归因模型是一个或一组规则,用于确定如何将销售和转化功劳分配给转化路径中的接触点。 如今,Google Analytics(分析)提供了七个预定义的归因模型,甚至可以定制的自定义模型。
前面了解到归因分析的理论知识和数据采集,接着我们看如何搭建数据计算模型。比如我们现在希望对进入UP主视频播放页的来源进行归纳。 一、根据采集信息,对采集页面进行梳理整合。 outputData 输出数据表 bili_ads.ads_dot_detail_1d Objects 归因对象 uuid,user_id Dimensions 归因维度 up_id_com,app_key recent,average startDate 进行归因计算的日期 ${yyyy_mm_dd} traceBackDays 往前追溯的天数 0 maxIntervalHours 最大归因间隔(小时) ,我们可以看到用户user_id=123456 在2022年3月25日通过Bilibili的IOS端坑位=‘历史记录’进入娱乐-鬼畜区的up主的30689558 贡献的观看时长为20mins. 分享、点赞、在看,给个3连击呗!
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 如果这个数据指标接近1,证明广告平台将视频广告的曝光数据直接回传给广告主;若这个指标值范围在0.5~0.7,有很大的概率是广告平台将有效视频曝光(3s)的数据回传给广告主作为归因数据。 其次,广告主增长营销部门下属有多个团队,各个团队之间数据并不透明互通导致难以分析有效触点归因的实际影响。 有效触点归因从本质上来说并不会带来更多的转化。只是在广告主内部多个营销部门左手倒右手。 由于有效触点归因会将部分原来属于“自然量”的转化归入到“有效触点”的广告效果上,从而使得这部分的转化量减少。同时,由于增长部门各个团队之间数据没有完全透明互通,使得分析难度大大增加。 这需要一个有全局视角且懂归因的人来统筹分析这个事情的影响! 那是不是代表无法解决。当然不是! 历史上,Amazon 和 Facebook 都曾经遇到过相同的情况。 大概是2016年到2017年的事情。
导读:归因分析是用于确定如何将转化功劳分配给各转化路径,从而结合单次的转化成本对后续的投放策略进行优化,本次我们就来介绍一下归因分析的几种常用方法。 1 什么是归因分析? 广义的归因分析指找到事情发展的原因,我们介绍过的公式法、漏洞模型等核心都是为了定位原因。 我们日常在互联网广告行业中常说的归因分析特指渠道转化的贡献分析,如我们在四个渠道投放产品广告,通过归因分析判断哪个渠道转化效果最好,进而优化渠道投放策略。 2 几种常见的归因分析模型 有一天三猫依次在a、b、c、d这4个不同的app上都看到了同一款防脱洗发水广告,并在最后看到的d这个app上点击详情页并下单购买,那如何判断每个渠道对三猫发生消费转化的贡献呢 3 学习卡 下图对相关性分析方法重点内容进行了罗列,可保存到相册随时查看。
通过分析每个归因模型,我们可以更好地了解每个营销渠道的投资回报率。不一定有“最佳”归因模型,但我们可以选择一种作为报告和分析的主要归因模型。 - 最终互动归因 ? 在这种情况下有3个接触点。每个接触点可获得33%的功劳。 线性归因对所有事物都给予同等的重视。该模型不会突出显示最有效的策略。 - 自定义归因模型 ? 通过给你认为的最重要的任何接触点赋予自定义权重的一种归因模型。 - 投资决策领域的归因分析 归因分析,一种评估工具,用于根据特定基准来解释和分析投资组合的绩效。 我们进一步抽象下: 我们把行业记为H, 投资组合记为A, 权重记为w, 分配效果记为A(w1 * H1,w2 * H2,w3 * H3) 基准记为H1base,Abase 分配影响记为Ea 选择影响记为 我们能做的,就是仔细地研究分析各种影响因素,把各种分类方式(不同模型)对比研究分析。 以上为全文,总结下: 归因是描述因果关系的一种分析方法,我们需要明确影响因素,在影响因素的范围下进行归因分析。
说到渠道归因,那最容易想到的就是传统的渠道归因,这种方法一般是基于业务决策的。 首次归因:首次点击渠道赋予全部转化 末次归因:末次点击渠道赋予全部转化 线性(平均)归因:每个渠道均分转化 位置归因:自定义位置的权重,一般首位占50%,其余为0 时间衰减归因:距离转化的时间越短的渠道 累计未转化次数 path total_conversions total_conversion_value total_null 0 eta > iota > alpha > eta 1 0.244 3 1 iota > iota > iota > iota 2 3.195 6 2 alpha > iota > alpha > alpha > alpha > iota > ... 2 6.754 6 3 7377.5 1 beta 1910.0 2 delta 3.0 3 epsilon 315.0 4 eta 3665.5 5 gamma 128.5 6 iota 3980.5 7 kappa 152.0
渠道归因(三)基于Shapley Value的渠道归因 通过Shapley Value可以计算每个渠道的贡献权重,而且沙普利值的计算只需要参加的渠道总数,不考虑顺序,因此计算成本也较低。 pd import matplotlib.pyplot as plt import seaborn as sns 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 成功转化次数 marketing_channel_subset converted 0 Email 110 1 Email,Facebook 11 2 Email,Facebook,House Ads 8 3 = json.load(f) journeys[:5] # 用户各渠道流转日志,数字表示渠道代号 数据格式要求:json数据,每一行为成功转化的流转路径,数字为渠道ID [[16, 4, 3, 总结 日常业务中,可以结合多个方法看一下归因的差异。
三、数据产品异常归因分析设计思路 1.数据质量保证 数据波动时,很多业务第一反应是“数据准不准”,尤其是当数据质量问题比较频繁时,会降低业务对数据产品的信任度。 3.利用基尼系数的思想实现异常归因报告自动生成 确定数据质量准确无误后,指标波动异常分析的一般流程是,先结合常见的几种异常原因(业务动作、市场环境等)提出初步假设。 ,分城市看大盘贡献度Top3的城市为:上海B1/A,北京B2/A,南京B3/A。 四、小结 指标波动是数据工作中最常见的问题,高效的异常波动的归因分析流程主要从以下几个方面逐步完善: 建立完善的数据质量监控体系,才有足够的自信,确认不是数据问题 利用基尼系数分析或其他分析方法,产品化影响波动的关键维度以及影响率 ,可应用与定制化的可视化报表或自主分析BI工具中 了解波动的常见原因,将定量的数据分析结果与业务内外部的因素结合起来 建立便捷的信息共享通道,降低沟通成本 关于波动的异常归因,你遇到过什么问题,目前是怎么解决的呢
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 我们如何用这个方法来分析不同渠道的贡献度呢? 下面是一个例子, 假设有3个渠道:信息流(A),开屏(B),视频前贴©,他们的独自投放效果和两两投放效果如下图所标识。 三个渠道,有3*2种联盟次序,具体计算如下: 因此,信息流的夏普里值为20,开屏的夏普里值为33.3,视频前贴的夏普里值为46.6。 关于shap值计算,也可以参考:数据运营36计(四):互联网广告渠道归因分析之Sharply Value 1.2 SHAP值和马尔科夫链 归因的比较 参考:高阶媒体归因:沙普利值vs马尔科夫链 相同点:
之前几篇多渠道归因分析应该算是比较通用的一些方法论: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因(三 ) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五) profile — embedding layer + ANN:额外融入用户属性信息 1.6 融合层 2 下游应用 2.1 下游应用一:分配路径权重 2.2 下游应用二:预算评估 2.3 确定最有影响力的路径 3 假设有 如下7-13个 触点的路径: 1.1 与markov、Sharpley 的差异 markov、Sharpley 是市面上最、最常见的两种归因分析的方法了,但是两种都缺少考虑: 长路径序列下路径间的影响 (markov考虑了顺序) 未融入用户属性信息 1.2 注意力的循环神经网络多点触摸归因模型框架 一种基于注意力的循环神经网络多点触摸归因模型,以监督学习的方式预测一系列事件是否导致转换(购买)。
今天这篇文章将会一起深入探究十一种归因模型并分析它们各自的优缺点。 每种归因模型都有各自适用的场景和环境,实际使用中通常结合业务场景,对比测试模型的效果,以期找到最合适的。 基于末次归因模型衡量和评估销售机会建立(大部分B2B营销渠道漏斗的最后一环)的整个过程,在分析技术方面最不容易发生错误。 四、末次非直接点击归因模型 ? 如果说这个模型比末次互动归因模型稍微有用一些,那是因为它排除了“直接来源”数据的限制。 当谈到网站和营销分析,“直接”流量是一大痛点。 在营销分析里,直接流量通常被定义为手动输入URL的访客流量。然而,现实是市面上的所有分析工具都把没有来源页的流量视为直接流量。 通过分析现有的用户数据,可以看出哪些营销渠道有突出的影响,或者发现是否有某个步骤在用户购物旅程中是很重要的。
渠道归因(二)基于马尔可夫链的渠道归因 在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。 本文主要参考自python实现马尔可夫链归因[1]。 马尔可夫链是一个过程,它映射运动并给出概率分布,从一个状态转移到另一个状态。 所以马尔可夫链模型可以用来做归因分析。 total_conversion_value 0 eta 3440.255709 13711.503304 1 iota 3732.042103 14535.970443 2 alpha 5821.609182 19315.152418 3 共勉~ 参考资料 [1] python实现马尔可夫链归因: https://mattzheng.blog.csdn.net/article/details/117296062
前面介绍了归因分析的理论、数据采集、数据计算,最后我们着重介绍一下如何对前面生成的数据,进行可视化分析沉淀,让业务能高效的进行日常运营迭代。 类型:粉丝、游客 客户端:PC、移动端、H5、其他、站外 时间维度:今日、昨天、近7日日均、近30日日均 3.流量来源平台界面呈现 流量来源分析平台首页 可以展示不同时间不同人群不同流量来源不同数据指标的具体数据 指标可视化图表展示如下: 1)单个视频流量来源的数据趋势 3)受众群体特征 其实单纯的通过可视化图表呈现其实远远不够,更多的是我们需要对呈现的数据进行解读,因此小编建议大家有注重点,选择主要的去研究 ④ 总结 流量来源分析是各大互联网公司日常运营分析的不可或缺的部分,打造了流量来源分析平台后能大大的减轻了数据分析师取数负担,也能让运营产品直接通过可视化的方式获取对应数据进行自助分析,大大缩短的取数的排队周期 分享、点赞、在看,给个3连击呗!
实时数据反馈与归因通过SDK集成实现实时数据同步。广告主可实时查看各渠道的ROI,并调用API接口同步有效推广数据至财务系统,基于用户生命周期价值动态调整预算分配策略。 3、技术实现路径通过三步完成结算体系升级:SDK集成:接入openinstall SDK(Android/iOS/HarmonyOS全平台支持)渠道配置:在管理后台设置「渠道分组-超级渠道-创建分发 -数据分析」策略系统对接:通过API将核销数据同步至ERP、CRM、分账系统在流量红利见顶、渠道博弈加剧的行业背景下,解决CPA/CPS统计难题的本质在于构建实时精准的数据追踪体系。 openinstall的技术方案通过全链路追踪与实时归因两大核心能力,重构了渠道推广的价值分配逻辑:一方面,动态参数化链接将传统渠道打包与邀请码等繁杂成本转化为生成式流程;另一方面,秒级实时数据反馈与层级绑定功能 这套技术框架的价值不仅在于降低结算摩擦,更深远的意义在于重构了渠道合作生态的底层规则——当每一个用户的点击、激活、付费行为都能被精准归因到对应渠道,广告主与推广者之间CP结算的零和博弈将转化为基于数据可视化的协同共创
解释 这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开app都回传给渠道商,渠道商自己归因 有的如华为是从应用商店安装时, 应用商店把归因信息写入到 app, 然后首次安装启动时能从本地存储获取到归因数据 曝光归因 曝光归因由于有数据量极大、不会使用此项 点击归因(常用) 所谓点击归因, 就是点击广告之后首个转化, 基本都是用这种方式归因 归因模型 首次归因模型 多个归因源事件时,认为第一个归因源事件的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。 平均归因模型 多个归因源事件时,认为每个归因源事件平均分配此次功劳。 links where id = {$id}"; // $id if (is_null($link)) { return 'FAIL'; } // 3. 查询 app $app = "select * apps where id={$appId}"; // 3.
自然语言驱动,一句话启动深度归因借助强大的自然语言处理(NLP)引擎,用户不再需要学习复杂的软件操作,只需用日常语言提问,系统便能自动理解意图并启动归因分析。 根据,DataFocus 在此场景下表现出“归因灵活全面”的特性,能够自动调用归因分析插件,完成多指标的因果分析,而传统BI工具则需要繁琐的人工操作。 智能匹配维度: 自动选取最相关的业务维度(如产品类别、区域、渠道等)进行对比分析。调用归因模型: 在后台运用Delta法或夏普利值等成熟的归因模型进行计算,量化各维度对总体变化的贡献度。 竞品分析报告指出,DataFocus的报告生成效率是传统BI工具的3倍,并且支持实时编辑,自由度极高。专家模式:让AI成为你的专属分析师为了满足更深度的分析需求,ChatBI还提供了“专家模式”。 这种能力使其分析结果更贴近实际业务场景,真正帮助用户解决问题。图3:“小慧分析总结”功能自动生成对图表数据的文字解读,模拟分析师的洞察过程。
这些,其实流量归因分析模型都可以告诉你: 如何将钱花的更有价值:优先将广告预算投放在拉新及留存效果最佳的渠道,缩短用户在核心流程上的路径。 二、归因理论 业内通用五大基本归因方案,如下: 首次触点模型: 多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」功劳为 100% 。 位置归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 功劳,其余「待归因事件」平分剩余的 20% 功劳。 四、参考资料: 1.黄业忠.流量的高级分析与流量渠道的协同:归因和归分析型[G],2018-08-09 2.数据分析社区.电商流量来源分析平台:从数据底层到数据可视化[G],2021-05-11 3.海阁 .数据分析中的常用方法:什么是归因查找法[G],2020-02-08