来源:腾讯广告 & 营销学院 公众号后台回复: 报告 获取源文件 欢迎添加本站微信:datajh (可上下滑动或点单个图片放大左右滑动查看) 知识星球历史已上传相关资料概览: 报告已同步至知识星球,需要源文件请公众号后台回复:报告 报告仅做分享交流,文章开头已注明来源,如有侵权,请联系删除;
人群LookALike是给定种子人群,然后通过技术手段找到与该种子人群相似的用户群体。 人群LookALike在广告投放中使用较多,比如客户提供一个高价值人群,借助广告平台LookALike能力可以找到更多潜在的高价值用户用于广告投放。下面介绍几种常见的LookALike实现方案。 图5-26展示了基于向量求LookALike人群的主要流程。图片基于种子人群特征分布计算相似人群。 通过分类算法计算相似人群也是业界常见的人群LookALike实现方案,图5-28展示了其主要实现流程,其中分类模型可以使用传统的机器学习或者深度学习方法。 人群挖掘的思路是先找到训练样本(种子人群),然后通过LookALike的思路扩展种子人群。该方式与人群LookALike不同的是,人群挖掘的结果中可以包含种子人群中的用户数据。
小编说:本文主人公 英特 是一名传统的软件工程师,让我们与英特一起来研究如何实现自己的Lookalike算法,并尝试着在新浪微博上应用这一算法。 像Facebook 这样通过一群已有的用户发现并扩展出其他用户的推荐算法就叫Lookalike,当然英特并不清楚Facebook 的算法细节,而各个公司实现Lookalike 的方式也各有不同。 Linkedin 的lookalike 流程图 在流程图中,Linkedin 给出了如何利用营销活动数据、目标受众基础数据去预测目标用户行为进而发现新的用户。 Lookalike 算法流程图 在以上步骤提取完特征后,英特使用一个两层的神经网络做最后的特征归并提取,算法结构示意图如下。 ? 结 果 英特根据Lookalike 思想完整实现了算法,并在实际产品中投入试用,针对某客户(乳品领域世界排名前三的品牌主)计算出结果(部分)如下。 ?
什么是Lookalike? ? ? 图片引用来自参考资料1 具体来讲,相似人群拓展(Lookalike)是基于种子用户,通过用户画像、算法模型等找到与种子用户更多拥有潜在关联性的拓展技术。 工业界中的Lookalike应用 ? ? Facebook Lookalike Audiences Facebook的“Lookalike Audiences”,可以根据Custom Audiences所筛选出的用户名单为参考,再筛选出与其相似的人群 阿里达摩盘DMP 阿里推出达摩盘(DMP)Lookalike 模型根据对店铺或品牌最忠实的那批用户(种子用户),并通过Lookalike 模型找到与这些种子用户相似的人来增加店铺的有效浏览和转化。 竞赛中的Lookalike ?
什么是Lookalike? 具体来讲,相似人群扩散(Lookalike)是基于种子用户,通过用户画像、算法模型等找到与种子用户更多拥有潜在关联性的拓展技术。 Lookalike算法是计算广告中的术语,不是单指某一种算法,而是一类方法的统称,这类方法综合运用多种技术,其目的就是为了实现人群包扩充。 02 Facebook Lookalike Audiences Facebook的“Lookalike Audiences”,可以根据Custom Audiences所筛选出的用户名单为参考,再筛选出与其相似的人群 03 阿里达摩盘DMP 阿里推出达摩盘(DMP)Lookalike 模型根据对店铺或品牌最忠实的那批用户(种子用户),并通过Lookalike 模型找到与这些种子用户相似的人来增加店铺的有效浏览和转化 算法竞赛中的Lookalike 腾讯广告算法大赛2018年的赛题,题目如下: 相似人群拓展(Lookalike)基于广告主提供的一个种子人群(又称为种子包),自动计算出与之相似的人群(称为扩展人群)。
Lookalike技术:让客户量级的倍增的利器 Lookalike技术基于种子用户画像和社交关系链寻找相似的受众,即在大量用户群中选择一组特定的种子(即有转化行为的)受众,包括但不局限于点击、下载、安装 Lookalike技术具有3大优势: 相比显式用户定向标签(如人口学,兴趣,行为等)需要大量广告主人工参与试错,隐式 Lookalike 几乎不需要广告主参与。 Lookalike会对种子人群各个维度的特征(人口基础属性、社交属性、行为属性等)进行全方位分析。 Lookalike技术成今年腾讯广告算法大赛主题,探索更多新算法和应用 腾讯社交广告早在 2013 年开始调研探索 Lookalike 技术,设计基于种子用户画像和关系链寻找相似人群,即根据种子人群的共有属性进行自动化扩展 这也是腾讯广告算法大赛将Lookalike技术作为今年的主题的原因。 腾讯广告算法大赛主办方将提供相似人群拓展产品中的模拟真实商业环境的数据包作为比赛数据,遴选优秀的Lookalike算法和技术英才。
Lookalike Audiences 人群定向策略,简单的说就是用数据描述人群,以人找人,因为大部分商家都有一定量的自有用户(可能来自以往的消费记录或自身会员)那么这些用户的相似用户就是最好的受众。 Lookalike 技术的产生有效弥补了标签筛选的不足,是当前社交广告中的主流方法。 商家可以选择特征从不同维度上观察和筛选人群,确认后可以直接投放,当召回不足时可以使用 Lookalike 系统对其进行扩展,目前的扩展最大规模为种子用户的 100 倍,另外我们的 Lookalike 系统还可以对召回过量的问题设置一个 朋友圈社交广告 Lookalike 打分算法 看了上面的内容可能有读者会问朋友圈社交广告的 Lookalike 打分与相似度 Lookalike 打分有何不同? ,评论,转发,最好是关注,下单等操作,因此相似度 Lookalike 分数还需要使用用户在微信朋友圈广告上的各项互动因子进行缩放, 互动因子表示当前用户倾向于广告互动的程度,越大越可能产生互动。
「Lookalike」算法优化,让广告主更懂客户 ? 换言之,Lookalike 就是将人工的分析和洞察完全自动化的技术。 「我们认为 Lookalike 是一个给到广告主的有效工具,可以在保护用户隐私的前提下,充分利用到腾讯用户群的覆盖度和我们的用户特征的丰富度。」 而从 Lookalike 技术的适用范围来看,它也有自身的针对性和普适性。 与此同时,Lookalike 的数据来源也显得尤为重要。但在实际应用中,一个非常重要的数据来源便是广告主的一方数据。
Lookalike,相似人群拓展的利器技术,现在被腾讯广告大赛玩出新水平。 7月30日,第二届腾讯广告算法大赛决赛举办,十支队伍从超过2万名选手中杀出重围,进入决赛现场。 腾讯社交广告基于成熟的算法技术能力,运用Lookalike技术,能在保证精准的前提下,帮助广告主触达最大化相似人群量级,让品牌找到更多“对的人”,从而高效促进营销目标转化。 罗征说,Lookalike在广告主应用中非常广泛,并且对他们的效果影响非常大。今年将Lookalike作为赛题,除了有趣、好玩外,一个重要的原则是算法对广告主有很大的影响力。 腾讯社交广告在Lookalike等大规模推荐技术方面,进行了多年积累与探索,结合产品、运营推广,共同驱动社交广告业务高速增长。 后期持续发掘最优的广告位置和用户特征,利用Lookalike对用户进行评分,找到类似人群,实现精准投放。 另外,AI在广告审核中也发挥重要作用。
Facebook这种通过一群已有的用户发现并扩展出其他用户的推荐算法就叫Lookalike,当然Facebook的算法细节笔者并不清楚,各个公司实现Lookalike也各有不同。 下面让我们结合前人的工作,实现自己的Lookalike算法,并尝试着在新浪微博上应用这一算法。 图1 LinkedIn的Lookalike算法流程图 在图1中,LinkedIn给出了如何利用营销活动数据、目标受众基础数据去预测目标用户行为进而发现新的用户。 图5 Lookalike算法示意图 在以上步骤中特征提取完成后,我们使用一个2层的神经网络做最后的特征提取,算法结构示意图如图6所示。 ? 结果 我司算法团队根据Lookalike思想完整实现其算法,并在实际产品中投入试用。针对某客户(乳品领域世界排名前三的品牌主)计算出结果(部分): ?
2014 年加入微信,先后负责用户画像建设,lookalike 人群定向,微信斑马系统,小程序广告系统,小程序商业化技术,专注于自然语言处理,计算广告,机器学习,数据变现等技术方向,加入微信前曾就职于微软
github.com/BladeCoda/Tencent2017_Final_Coda_Allegro 2018腾讯广告算法大赛 本次算法大赛的题目源于腾讯社交广告业务中的一个真实的广告产品——相似人群拓展(Lookalike 在实际广告业务应用场景中,Lookalike 能基于广告主已有的消费者,找出和已有消费者相似的潜在消费者,以此有效帮助广告主挖掘新客、拓展业务。 目前,腾讯社交广告 Lookalike 相似人群拓展产品以广告主提供的第一方数据及广告投放效果数据(即后文提到的种子包人群)为基础,结合腾讯丰富的数据标签能力,透过深度神经网络挖掘,实现了可在线实时为多个广告主同时拓展具有相似特征的高质潜客的能力 第二届腾讯社交广告算法大赛_rank7 https://github.com/guoday/Tencent2018_Lookalike_Rank7th ? /github.com/ouwenjie03/tencent-ad-game 第二届腾讯社交广告算法大赛_rank10 https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th
12 测试相似受众 lookalike audience(相似受众群体)是指其用户特征与网站自定义受众http://www.socialmediaexaminer.com/retarget-content-to-facebook-custom-audiences 要创建lookalike audience(相似受众群体),请登录到您的advertising manager(广告管理器),然后点击Audiences(受众群体)。 选择此选项可创建一组Lookalike Audience(相似受众群体) 接下来,选择the sourceaudience of your lookalike audience(您的相似受众群体的来源受众群体 此外,您可以选择创建新customer list(客户列表)的lookalike audience(相似受众群体)。 14 测试出价策略 竞价策略对Facebook广告的投放影响很大。
简称“Lookalike”。先需要广告主提供本则广告起到作用的典型用户,以手机为例,受广告影响感兴趣点击浏览或预购某手机的用户,大约几百或几千个。 大数据公司通过Lookalike算法(专业的术语更可能是稀疏矩阵),寻找与这几百/千个用户高度相似的其它数十万/百万客户群进行投放。 而且由于数据本身的分割,有的专注于运营商,有的专注于APP联盟采集,有的专注于电商,有的专注于银行,要从分割的数据中推断出客户的身份信息,Lookalike就是不可避免的手段。 唯一的问题是,如果由几百个种子用户推断出新的几百个目标用户,准确性可能高达9成,但如果如某广告公司宣称,对康师傅辣味面进行移动DSP投放时,根据历史投放数据分析挖掘,形成样本库,再通过Lookalike 显然不是不靠谱的协同过滤规则,也不是根本不知道原因的Lookalike,既然最重要的就是到达目标消费者,那么靠谱的身份识别应该就是精准广告的核心。 什么是靠谱的身份识别?
简称“Lookalike”。先需要广告主提供本则广告起到作用的典型用户,以手机为例,受广告影响感兴趣点击浏览或预购某手机的用户,大约几百或几千个。 大数据公司通过Lookalike算法(专业的术语更可能是稀疏矩阵),寻找与这几百/千个用户高度相似的其它数十万/百万客户群进行投放。 而且由于数据本身的分割,有的专注于运营商,有的专注于APP联盟采集,有的专注于电商,有的专注于银行,要从分割的数据中推断出客户的身份信息,Lookalike就是不可避免的手段。 唯一的问题是,如果由几百个种子用户推断出新的几百个目标用户,准确性可能高达9成,但如果如某广告公司宣称,对康师傅辣味面进行移动DSP投放时,根据历史投放数据分析挖掘,形成样本库,再通过Lookalike 显然不是不靠谱的协同过滤规则,也不是根本不知道原因的Lookalike,既然最重要的就是到达目标消费者,那么靠谱的身份识别应该就是精准广告的核心。 什么是靠谱的身份识别?
yuxiaowww/IJCAI-18-TIANCHI 3.2018 腾讯广告算法大赛 (http://u6.gg/f3ysU) 本次算法大赛的题目源自一个基于真实业务场景的广告技术产品——腾讯社交广告 Lookalike Tencent_Ads_Algo_2018 rank6: https://github.com/nzc/tencent-contest Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th Rank9: https://github.com/ouwenjie03/tencent-ad-game Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th rank10(初赛): https://github.com/ShawnyXiao/2018-Tencent-Lookalike Rank11: https://github.com/liupengsay
张夏天:我们目前的大规模机器学习是基于Spark平台的,目前主要用于Lookalike(相似人群)挖掘。我们累积的数设备数已经超过23亿,在这么大的池子中做Lookalike是一个规模很大的问题。
yuxiaowww/IJCAI-18-TIANCHI 3.2018 腾讯广告算法大赛 (http://u6.gg/f3ysU) 本次算法大赛的题目源自一个基于真实业务场景的广告技术产品——腾讯社交广告 Lookalike Tencent_Ads_Algo_2018 rank6: https://github.com/nzc/tencent-contest Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th Rank9: https://github.com/ouwenjie03/tencent-ad-game Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th rank10(初赛): https://github.com/ShawnyXiao/2018-Tencent-Lookalike Rank11: https://github.com/liupengsay
本文内容: 赛题分析 特征构造 特征选择 模型选择与评估 最终融合 不足与总结 1.赛题分析 相似人群拓展(Lookalike)的工作机制是基于种子用户画像和社交关系链寻找出相似用户。 ? Lookalike 技术,设计基于种子用户画像和关系链寻找相似人群,即根据种子人群的共有属性进行自动化扩展,以扩大潜在用户覆盖面,提升广告效果。 由于Lookalike相似人群扩展和广告CTR有些类似,所以我们沿用了很多阿里妈妈搜索广告转化预测的特征和模型。
企点营销自动化具体实现 01 基于高质量潜客及老客的目标人群精准触达 基于高质量潜客,进行Lookalike, 对接TSA,短信进行目标人群触达 ? ?