让我们来看看每一个普及的模型,看看每一步骤的归因。这样我们就可以权衡利弊。 最后点击(Last-Click) ? 这归因模型功劳于转化前的最后一个通道,这就是我们以上举例的重定向广告。 这类归因模型允许你创建混合型最后单击和初次点击的模型,并给每个触达点相应的百分比。 优点:如果你的营销项目主旨是保持与用户的关系和认知,那么线性的归因就比较有用。比如说,如果你有一个品牌的广告项目,每一个媒介点在用户考虑阶段都同等重要,那么线性的归因能够帮助你您可视化这一进程。 缺点:时间衰减归因对最后转化有贡献,但是是初始的触达的渠道有打折扣,例如Facebook或者最初的搜索会话。 自定义(Custom ) ? 这就是“圣杯”归因模型! 你需要对其他模型非常了解再来运用自定义归因模型 正如你所看到的,这里有很多归因模型,找到一个适合你的业务的模型途径需要测试并且优化。使用一些虚拟数据集来测试不同的广告项目和媒介渠道。
文章目录 1 归因分析 2 传统归因分析方法 2.1 传统归因分析 2.2.1 最终互动归因模型 2.2.2 最终非直接点击归因模型 2.2.3 最终AD点击归因 2.2.4首次互动归因 2.2.5 :互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因(三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution 2 传统归因分析方法 2.1 传统归因分析 参考自文章[1][2][3] 还有文章:【数据分析思维】多因素影响下如何归因? GA里面的归因模型有非常多种,分为单触点归因和多触点归因。 6 有效触点归因很早就存在了,最著名的是Facebook 的View-through Attribution,然后就是海外2016年左右兴起的激励视频广告。 参考文献 1 互联网广告的归因分析(Attribution Analysis) 2 2.3、流量的高级分析与流量渠道的协同:归因和归分析型 3 【科普】深度解析亚马逊广告归因(含案例解析) 4 【数据分析思维
今天,我们将列举一些常用的归因模型,并演示如何使用Googel Analytics 归因模型对比工具来为你的业务挑选最适合的模型。 归因模型应用示例 假设你的网站售卖烧烤架。 末次非直接点击归因模型忽视了直接流量,把转化功劳全归因于在完成销售之前的最后一次渠道点击。 我们再来看更多模型: 与末次互动相似,首次互动归因模型把转化功劳全归因于首次触点——在Grillmaster先生的例子中,即为自然搜索。 线性归因模型在各个渠道之间平均分配成功转化分数。 相反,他们帮助我们分析并且找出多触点间所有行为数据的意义,因此我们能做出基于数据的判断。 在我们的实际工作中,可以经常尝试多种归因模型,对比分析归因模型对多渠道效果转化的效果,选择适合自己公司业务的最优模型。
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 所以马尔可夫链模型可以用来做归因分析。 这是一个多渠道归因模型问题。 Google Analytics(分析)的定义有助于:归因模型是一个或一组规则,用于确定如何将销售和转化功劳分配给转化路径中的接触点。 如今,Google Analytics(分析)提供了七个预定义的归因模型,甚至可以定制的自定义模型。
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 首先,广告主做用户增长的团队需要有懂广告归因的人,况且即便懂了这套归因逻辑,也很难区分有效触点归因“抢”了多少自然量。 其次,广告主增长营销部门下属有多个团队,各个团队之间数据并不透明互通导致难以分析有效触点归因的实际影响。 有效触点归因从本质上来说并不会带来更多的转化。只是在广告主内部多个营销部门左手倒右手。 由于有效触点归因会将部分原来属于“自然量”的转化归入到“有效触点”的广告效果上,从而使得这部分的转化量减少。同时,由于增长部门各个团队之间数据没有完全透明互通,使得分析难度大大增加。 这需要一个有全局视角且懂归因的人来统筹分析这个事情的影响! 那是不是代表无法解决。当然不是! 历史上,Amazon 和 Facebook 都曾经遇到过相同的情况。 大概是2016年到2017年的事情。
导读:归因分析是用于确定如何将转化功劳分配给各转化路径,从而结合单次的转化成本对后续的投放策略进行优化,本次我们就来介绍一下归因分析的几种常用方法。 1 什么是归因分析? 广义的归因分析指找到事情发展的原因,我们介绍过的公式法、漏洞模型等核心都是为了定位原因。 我们日常在互联网广告行业中常说的归因分析特指渠道转化的贡献分析,如我们在四个渠道投放产品广告,通过归因分析判断哪个渠道转化效果最好,进而优化渠道投放策略。 2 几种常见的归因分析模型 有一天三猫依次在a、b、c、d这4个不同的app上都看到了同一款防脱洗发水广告,并在最后看到的d这个app上点击详情页并下单购买,那如何判断每个渠道对三猫发生消费转化的贡献呢 相关性分析 相关性分析是通过整体情况来确定渠道重要性的方法。通过计算各渠道直接转化量与整体转化量的相关性系数,确定各渠道的贡献度。根据算出的渠道贡献度,确定三猫此次的转化主要贡献渠道。
基于此,就有了线上全域归因、线上局部归因。 线上局部归因,我们目前的技术手段所实现的基本都是指的是线上的局部归因,是忽略了我们所不能掌握的因素的一种归因分析手段。 通过分析每个归因模型,我们可以更好地了解每个营销渠道的投资回报率。不一定有“最佳”归因模型,但我们可以选择一种作为报告和分析的主要归因模型。 - 最终互动归因 ? - 自定义归因模型 ? 通过给你认为的最重要的任何接触点赋予自定义权重的一种归因模型。 - 投资决策领域的归因分析 归因分析,一种评估工具,用于根据特定基准来解释和分析投资组合的绩效。 而如果拆开来看,在6个院系的4个里,女生的录取率大于男生。如果按照这样的分类,女生实际上比男生的录取率还高一点点。 我们能做的,就是仔细地研究分析各种影响因素,把各种分类方式(不同模型)对比研究分析。 以上为全文,总结下: 归因是描述因果关系的一种分析方法,我们需要明确影响因素,在影响因素的范围下进行归因分析。
说到渠道归因,那最容易想到的就是传统的渠道归因,这种方法一般是基于业务决策的。 首次归因:首次点击渠道赋予全部转化 末次归因:末次点击渠道赋予全部转化 线性(平均)归因:每个渠道均分转化 位置归因:自定义位置的权重,一般首位占50%,其余为0 时间衰减归因:距离转化的时间越短的渠道 total_conversion_value total_null 0 eta > iota > alpha > eta 1 0.244 3 1 iota > iota > iota > iota 2 3.195 6 2 alpha > iota > alpha > alpha > alpha > iota > ... 2 6.754 6 3 beta > eta 1 2.402 3 4 iota > eta > theta 7377.5 1 beta 1910.0 2 delta 3.0 3 epsilon 315.0 4 eta 3665.5 5 gamma 128.5 6 iota 3980.5 7 kappa 152.0
译者:互联网数据官志愿者 王全鹏 前言:如何选择正确的归因模型来进行营销效果评估?如何评估你的归因模型供应商? 专栏作家 Alison Lohse 给出了6个问题帮你理清思路,并且避过归因模型的那些坑。 ? 有些公告比较棘手。FaceBook将会因为其错误使用视频广告效果评估指标而被起诉。 这里有一个问题列表,可以用来向归因模型供应商和数据科学家提问,以便系统、深入的了解归因相关的话题。 问题1: 模型使用了什么算法? 问题6:洞察的粒度有多细? 理想的答案:精细的用户级数据。 效果营销人员需要以很细的粒度,在每天或更短的周期内调整其广告策略,以适应不断变化的趋势。 相比长期趋势来说,算法更难预测较小、较短期的变化。
渠道归因(三)基于Shapley Value的渠道归因 通过Shapley Value可以计算每个渠道的贡献权重,而且沙普利值的计算只需要参加的渠道总数,不考虑顺序,因此计算成本也较低。 pd import matplotlib.pyplot as plt import seaborn as sns 本文所有数据如果有需要的同学可关注公众号HsuHeinrich,回复【数据挖掘-渠道归因 ) journeys[:5] # 用户各渠道流转日志,数字表示渠道代号 数据格式要求:json数据,每一行为成功转化的流转路径,数字为渠道ID [[16, 4, 3, 5, 10, 8, 6, 2392 Channel 1: 73.73 Channel 2: 92.38 Channel 3: 118.34 Channel 4: 248.21 Channel 5: 75.04 Channel 6: 总结 日常业务中,可以结合多个方法看一下归因的差异。
6.竞对出现,互联网业务新入局者往往会在营销、补贴等方面投入更多的资源,以跑马圈地获取用户,对于忠诚度不高的趋利型用户,会被直接转移,百度、美团、饿了么外卖市场三足鼎立时,很多人同时装三个App,哪个补贴多用哪个 三、数据产品异常归因分析设计思路 1.数据质量保证 数据波动时,很多业务第一反应是“数据准不准”,尤其是当数据质量问题比较频繁时,会降低业务对数据产品的信任度。 3.利用基尼系数的思想实现异常归因报告自动生成 确定数据质量准确无误后,指标波动异常分析的一般流程是,先结合常见的几种异常原因(业务动作、市场环境等)提出初步假设。 四、小结 指标波动是数据工作中最常见的问题,高效的异常波动的归因分析流程主要从以下几个方面逐步完善: 建立完善的数据质量监控体系,才有足够的自信,确认不是数据问题 利用基尼系数分析或其他分析方法,产品化影响波动的关键维度以及影响率 ,可应用与定制化的可视化报表或自主分析BI工具中 了解波动的常见原因,将定量的数据分析结果与业务内外部的因素结合起来 建立便捷的信息共享通道,降低沟通成本 关于波动的异常归因,你遇到过什么问题,目前是怎么解决的呢
本篇主要是python实现马尔科夫链归因,关联的文章: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因( 三) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五 关于shap值计算,也可以参考:数据运营36计(四):互联网广告渠道归因分析之Sharply Value 1.2 SHAP值和马尔科夫链 归因的比较 参考:高阶媒体归因:沙普利值vs马尔科夫链 相同点: 2392 Channel 1: 73.73 Channel 2: 92.38 Channel 3: 118.34 Channel 4: 248.21 Channel 5: 75.04 Channel 6: 所以,出于不同目的,已经对数据的预处理,都会非常影响整分析结果。
之前几篇多渠道归因分析应该算是比较通用的一些方法论: 多渠道归因分析(Attribution):传统归因(一) 多渠道归因分析:互联网的归因江湖(二) 多渠道归因分析:python实现马尔可夫链归因(三 ) 多渠道归因分析(Attribution):python实现Shapley Value(四) 多渠道归因分析(Attribution):用attention-RNN来做归因建模(附代码demo)(五) 假设有 如下7-13个 触点的路径: 1.1 与markov、Sharpley 的差异 markov、Sharpley 是市面上最、最常见的两种归因分析的方法了,但是两种都缺少考虑: 长路径序列下路径间的影响 ana_mta_model.y==1].shape[0],ana_mta_model.all_X[ana_mta_model.y==1].shape[1]) # att_f = {m:0 for m in range(1,6) } # att_count_f = {m:0 for m in range(1,6)} att_f = {m:0 for m in range(1,n_channels+1)} att_count_f
今天这篇文章将会一起深入探究十一种归因模型并分析它们各自的优缺点。 每种归因模型都有各自适用的场景和环境,实际使用中通常结合业务场景,对比测试模型的效果,以期找到最合适的。 基于末次归因模型衡量和评估销售机会建立(大部分B2B营销渠道漏斗的最后一环)的整个过程,在分析技术方面最不容易发生错误。 四、末次非直接点击归因模型 ? 如果说这个模型比末次互动归因模型稍微有用一些,那是因为它排除了“直接来源”数据的限制。 当谈到网站和营销分析,“直接”流量是一大痛点。 在营销分析里,直接流量通常被定义为手动输入URL的访客流量。然而,现实是市面上的所有分析工具都把没有来源页的流量视为直接流量。 通过分析现有的用户数据,可以看出哪些营销渠道有突出的影响,或者发现是否有某个步骤在用户购物旅程中是很重要的。
渠道归因(二)基于马尔可夫链的渠道归因 在应用当中,序列中的每个点通常映射为一个广告触点,每个触点都有一定概率变成真正的转化。通过这种建模,可以选择最有效,概率最高的触点路径。 本文主要参考自python实现马尔可夫链归因[1]。 马尔可夫链是一个过程,它映射运动并给出概率分布,从一个状态转移到另一个状态。 所以马尔可夫链模型可以用来做归因分析。 19315.152418 3 beta 2386.059705 10133.518357 4 theta 1783.661989 7115.975460 5 lambda 1167.145576 4696.185913 6 共勉~ 参考资料 [1] python实现马尔可夫链归因: https://mattzheng.blog.csdn.net/article/details/117296062
前面介绍了归因分析的理论、数据采集、数据计算,最后我们着重介绍一下如何对前面生成的数据,进行可视化分析沉淀,让业务能高效的进行日常运营迭代。 类型:粉丝、游客 客户端:PC、移动端、H5、其他、站外 时间维度:今日、昨天、近7日日均、近30日日均 3.流量来源平台界面呈现 流量来源分析平台首页 可以展示不同时间不同人群不同流量来源不同数据指标的具体数据 可以分析整体的来源数据,也可以单独看每个视频的来源的数据。 ④ 总结 流量来源分析是各大互联网公司日常运营分析的不可或缺的部分,打造了流量来源分析平台后能大大的减轻了数据分析师取数负担,也能让运营产品直接通过可视化的方式获取对应数据进行自助分析,大大缩短的取数的排队周期
解释 这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开app都回传给渠道商,渠道商自己归因 有的如华为是从应用商店安装时, 应用商店把归因信息写入到 app, 然后首次安装启动时能从本地存储获取到归因数据 曝光归因 曝光归因由于有数据量极大、不会使用此项 点击归因(常用) 所谓点击归因, 就是点击广告之后首个转化, 基本都是用这种方式归因 归因模型 末次归因模型 (常用, 因为比较好实现) 多个归因源事件时,认为最后一个归因源事件的功劳为100%。 首次归因模型 多个归因源事件时,认为第一个归因源事件的功劳为100%。理由是第一个触点给用户建立了认知,与用户形成了连接。 平均归因模型 多个归因源事件时,认为每个归因源事件平均分配此次功劳。 时间衰减归因模型 加上了时间的影响因素,最后1次触达的贡献更高。 位置归因模型 多个归因源事件时,认为第一个归因源事件和最后一个归因源事件各占40%功劳,其余平分剩余的20%功劳。
自然语言驱动,一句话启动深度归因借助强大的自然语言处理(NLP)引擎,用户不再需要学习复杂的软件操作,只需用日常语言提问,系统便能自动理解意图并启动归因分析。 例如,当用户输入“解释2024年5月销量上升的原因”时,ChatBI能够自动识别这是一个归因分析任务。 根据,DataFocus 在此场景下表现出“归因灵活全面”的特性,能够自动调用归因分析插件,完成多指标的因果分析,而传统BI工具则需要繁琐的人工操作。 智能匹配维度: 自动选取最相关的业务维度(如产品类别、区域、渠道等)进行对比分析。调用归因模型: 在后台运用Delta法或夏普利值等成熟的归因模型进行计算,量化各维度对总体变化的贡献度。 结论:技术平权,释放数据价值从灵活全面的归因分析,到一键启动的预测能力,再到模拟专家思维的深度洞察,ChatBI正在重新定义数据分析的边界。
这些,其实流量归因分析模型都可以告诉你: 如何将钱花的更有价值:优先将广告预算投放在拉新及留存效果最佳的渠道,缩短用户在核心流程上的路径。 二、归因理论 业内通用五大基本归因方案,如下: 首次触点模型: 多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」功劳为 100% 。 位置归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 功劳,其余「待归因事件」平分剩余的 20% 功劳。 四、参考资料: 1.黄业忠.流量的高级分析与流量渠道的协同:归因和归分析型[G],2018-08-09 2.数据分析社区.电商流量来源分析平台:从数据底层到数据可视化[G],2021-05-11 3.海阁 .数据分析中的常用方法:什么是归因查找法[G],2020-02-08
前面了解到归因分析的理论知识和数据采集,接着我们看如何搭建数据计算模型。比如我们现在希望对进入UP主视频播放页的来源进行归纳。 一、根据采集信息,对采集页面进行梳理整合。 参数 含义 填写示例 ActionData 待归因的行为数据 bili_dwd.dwd_dot_log targetActionData 目标行为数据 bili_ads.ads_dot_target_1d outputData 输出数据表 bili_ads.ads_dot_detail_1d Objects 归因对象 uuid,user_id Dimensions 归因维度 up_id_com,app_key recent,average startDate 进行归因计算的日期 ${yyyy_mm_dd} traceBackDays 往前追溯的天数 0 maxIntervalHours 最大归因间隔(小时) 3.1 合并待归因和归因目标行为数据 输入:ActionData,targetActionData 中间处理:将ActionData中的additionalFields字段join到targetActionData