首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏TonyZhou的专栏

    CTR 预估模型的进化之路

    导语 笔者对各大厂商CTR预估模型的优缺点进行对比,并结合自身的使用和理解,梳理出一条CTR预估模型的发展脉络,希望帮助到有需要的同学。 0.  提纲 1. 背景 2. 扶持力度用于调节各个广告渠道 ) 互联网公司根据各自业务的特点,研发出了各种各样的 CTR 预估模型及其变种,本文尝试在众多流派和分支中梳理出一条 CTR 预估模型的发展脉络。 2. LR  海量高纬离散特征 (广点通精排) LR(逻辑回归)1可以称之上是 CTR 预估模型的开山鼻祖,也是工业界使用最为广泛的 CTR 预估模型。 LR 是广义线性模型,与传统线性模型相比,LR 使用了 Logit 变换将函数值映射到 0~1 区间,映射后的函数值就是 CTR预估值。 所以在 CTR 预估模型的早期,主要工作就是在做人工特征工程。人工特征工程不但极为繁琐,还需要大量的领域知识和试错。

    5.2K82发布于 2017-07-06
  • 来自专栏炼丹笔记

    CTR预估系列炼丹入门手册

    CTR预估系列家谱 ? 炼丹之前,先放一张CTR预估系列的家谱,让脉络更加清晰。 (一)FiBiNET:结合特征重要性和双线性特征交互进行CTR预估 ? (二)DSIN:利用用户时序行为中兴趣变化进行CTR预估 ? 2.0 前言 在读本文之前,我们需要先搞清楚两个概念,Sequence和Sessions。 相比于常用的AUC,在CTR预估场景中,不同的用户之间存在着差异,这种差异可以理解为一个闲逛的购物者和一个要买小米手机的购物者间的差异。 CTR预估场景下,构造的模型越复杂参数越多,越容易过拟合。实际场景中,存在着大量的长尾数据,这些数据的存在一方面在训练过程中增加了复杂度,另一方面在结果上产生了过拟合。 12.1 背景 CTR预估领域面临着诸多挑战,输入特征的稀疏高维问题,高阶特征的计算复杂度问题等。

    73313发布于 2021-05-14
  • 来自专栏牛肉圆粉不加葱

    CTR 预估候选集选择方案

    最近一段日子,怎么在一个大的新闻候选集合(假设有10w条新闻)选出用来做 CTR 预估的小集合(假设是100条新闻)困扰我们已久,昨夜我夜观星象,突来灵感,遂有此文。 废话,不选个小集合 CTR 预估怎么算得过来。好,那么目的一便是确定一个精简的集合以使 CTR 预估能在线上实时响应。再进一步思考,这100条新闻要是怎么样的新闻? 准确率高:具体指这100条新闻的每一条新闻都有一个相比于普通新闻更容易被点击的理由 覆盖率高:具体指100条新闻要覆盖绝大部分上面一点所说的理由(假设有若干个理由),以减小容易被点击新闻没有进入 CTR 预估流程的概率 顺着这样的思路,我整理出如下图的候选集触发方案: ? 这样虽然候选集并不是实时更新,但用户的属性是实时更新的,由于 CTR 预估是实时计算的,这样最终的推荐结果也是实时改变着 参考: http://toutiao.com/i6234278051245457921

    73820发布于 2018-08-24
  • 来自专栏算法一只狗

    CTR预估中怎么使用Transfromers

    不仅仅在NLP领域上,在CTR预估上,这些模型能够有效针对画像特征进行分类,从而有效学习高阶交互特征,提升CTR预估效果。 同时CTR预估往往存在文本信息,因此也可以使用Transformers等模型来挖掘词语之前的关系。CTR预估:旨在预测用户是否会点击所推荐的广告和商品,它通常会运用到在线广告和推荐系统中。 相关论文解析2.1 《AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks》论文指出,目前CTR 预估中,存在两个问题:输入的数据,比如用户数据和商品数据,这些都是高纬度和稀疏的特征,容易造成过拟合有效的预估中,需要进行特征交叉。

    29710编辑于 2024-11-27
  • 来自专栏小小挖掘机

    深度CTR预估模型的演化之路

    导读:本文主要介绍深度CTR经典预估模型的演化之路以及在2019工业界的最新进展。 )预估是一个重要问题。 在CTR预估任务中(以下简称CTR任务),我们通常利用user信息、item信息和context信息来预测user对item的CTR。 传统CTR预估任务采用的方法不外乎特征工程+LR/FM的组合,这种通过大量特征工程来提高预测效果的工作费时费力,且构造过程不具有通用性。 此外,在CTR任务中特征常以分组(group, 有时也称领域field)的离散特征信息,如user gender、item category等,在从FM推演各深度学习CTR预估模型(附代码)[1]中提到

    1.2K30发布于 2020-03-03
  • 来自专栏锅逗逗的杂学笔记

    深度CTR预估模型的演化之路

    在计算广告和推荐系统中,点击率(Click Through Rate,以下简称CTR预估是一个重要问题。 在CTR预估任务中(以下简称CTR任务),我们通常利用user信息、item信息和context信息来预测user对item的CTR。 传统CTR预估任务采用的方法不外乎特征工程+LR/FM的组合,这种通过大量特征工程来提高预测效果的工作费时费力,且构造过程不具有通用性。 深度CTR模型的基本框架 典型的深度CTR模型可以分成以下四个部分:输入、特征嵌入(Embedding)、特征交互(有时候也称为特征提取)和输出。 此外,在CTR任务中特征常以分组(group, 有时也称领域field)的离散特征信息,如user gender、item category等,在从FM推演各深度学习CTR预估模型(附代码)中提到“将特征具有领域关系的特点作为先验知识加入到神经网络的设计中去

    1K20编辑于 2022-08-01
  • 来自专栏秋枫学习笔记

    AT4CTR: 对比学习构建辅助任务提升CTR预估性能

    关注我们,一起学习 标题: AT4CTR: Auxiliary Match Tasks for Enhancing Click-Through Rate Prediction 地址:https://arxiv.org 导读 本文主要是针对CTR预估中数据稀疏性问题提出的相关方法,再原有的ctr预估模型中引入了一个辅助匹配任务,通过对比学习来提高点击率预测精度(AT4CTR)。 对于给定的历史行为序列,每次用前n个交互的聚合emb来预测第n+1个item;那么真实交互的为正样本,同batch其他交互序列同位置的item为负样本,构建对比损失 2.方法 如图所示,模型主要由Emb层,常规的点击率预估模型部分 mathbf{e_i^{k+1},r_i^k})/\tau_2)}{\sum_{j=1}^n\exp(sim(\mathbf{e_i^{k+1},r_j^k})/\tau_2)} 并且考虑原有的点击率预估的交叉熵损失函数的情况下

    1.2K10编辑于 2024-01-03
  • 来自专栏数据挖掘与AI算法

    CTR预估之深度学习模型DeepFM

    趁今天618剁手节,老shi决定带大家去剁手,哦不,是认识广告CTR预估中非常有名的深度学习模型DeepFM。话不多说,马上进入正题~ ? DeepFM模型最早是哈工大与华为诺亚方舟实验室论文中提出的,众所周知,在广告CTR预估任务中,最重要的是学习到用户点击行为背后隐含的特征组合。 在不同的推荐场景中,低阶组合特征或高阶组合特征都可能会对最终的CTR产生影响。 实验表明DeepFM比大部分CTR预估模型更加有效,并且效率高。 CTR预测学习隐式特征非常重要的一点是学习用户点击行为背后的特征组合。 一般来说,输入数据x是一个高维稀疏向量,而CTR预估的主要任务就是构建一个预测模型,从而预测在特定的情景下用户点击某个产品的概率。 2、FM部分结构图: ?

    1.3K20发布于 2020-07-17
  • 来自专栏机器学习AI算法工程

    程序化点击率预估CTR

    指标 广告点击率预估是程序化广告交易框架的非常重要的组件,点击率预估主要有两个层次的指标: 1. 排序指标。排序指标是最基本的指标,它决定了我们有没有能力把最合适的广告找出来去呈现给最合适的用户。 最近DNN很热,百度宣布DNN做CTR预估相比LR产生了20%的benefit,我不知道比较的benchmark,但就机理上来讲如果说DNN比原本传统的人工feature engineering的LR高 整个CTR预估模块的框架,包含了exploit/explore的逻辑。 ? 单纯点击率预估算法的框图如下; ? Step-by-step 1. 特征选择指标,特征选择主要有两个目的,一是去除冗余的特征,也就是特征之间可能是互相冗余的;二是去无用,有些特征对CTR预估这个任务贡献度很小或没有,对于这类特征选择,要小小地做,宁不足而不过分,因为单特征对任务贡献度小 预测CTR可信吗? 任何一个特征向量输入到这个CTR预测算法,算法都会像模像样地给你输出一个预测CTR。但这个CTR真的可信吗?

    2.2K80发布于 2018-03-13
  • 来自专栏数说工作室

    主流CTR预估模型的演化及对比

    本文以点击率(CTR预估为例,介绍常用的CTR预估模型,试图找出它们之间的关联和演化规律。 高维、稀疏、多Field是输入给CTR预估模型的特征数据的典型特点。以下介绍的模型都假设特征数据满足上述规律,那些只适用于小规模数据量的模型就不介绍了。 LR模型一直是CTR预估问题的benchmark模型,由于其简单、易于并行化实现、可解释性强等优点而被广泛使用。 通常CTR预估涉及到用户、物品、上下文等几方面的特征,往往单个特征对目标判定的贡献是较弱的,而不同类型的特征组合在一起就能够对目标的判定产生较强的贡献。 总结 主流的CTR预估模型已经从传统的宽度模型向深度模型转变,与之相应的人工特征工程的工作量也逐渐减少。

    1.3K40发布于 2019-07-17
  • 来自专栏深度学习与推荐系统

    稠密特征加入CTR预估模型的方法

    一般针对类别特征都是通过词嵌入的方法把稀疏特征转化为稠密特征然后再输入到神经网络中,不然直接输入会导致维度爆炸等问题,那么怎样把稠密数据加入到CTR预估网络模型中呢? 常规方法 1. 后续文章会有稠密特征加入CTR模型各个方法的具体实现代码,喜欢就关注一下吧 参考文献 [1] Multi-modal Representation Learning for Short Video Understanding

    1.4K00发布于 2020-01-06
  • 来自专栏炼丹笔记

    xDeepFM:CTR预估之特征交叉的艺术

    为什么做CTR预估不得不读呢? 模型解析 xDeepFM的网络框架如下图所示: ? pdf https://github.com/Leavingseason/xDeepFM/blob/master/exdeepfm/src/exDeepFM.py 我是二品炼丹师一元,目前跟着大哥们学习CTR

    1K20发布于 2021-05-14
  • 来自专栏鹅厂优文

    深度学习在CTR预估中的应用

    本文就近几年CTR预估领域中学术界的经典方法进行探究, 并比较各自之间模型设计的初衷和各自优缺点。通过十种不同CTR深度模型的比较,不同的模型本质上都可以由基础的底层组件组成。 对于大多数CTR模型来说,特征体系都极其庞大而且稀疏,典型的特征数量级n从百万级到千万级到亿级甚至更高,这么大规模的n作为网络输入在ctr预估的工业界场景中是不可接受的。 这种product思想来源于,在ctr预估中,认为特征之间的关系更多是一种and“且”的关系,而非add"加”的关系。 这种假设其实是不合理的, 不同特征在做交叉时,对ctr预估结果的贡献度是不一样的。 写在最后        ctr预估领域不像图像、语音等领域具有连续、稠密的数据以及空间、时间等的良好局部相关性,ctr预估中的大多数输入都是离散而且高维的,特征也分散在少量不同的field上。

    4.9K271发布于 2018-04-20
  • 来自专栏腾讯大数据的专栏

    CTR预估中GBDT与LR融合方案

    1背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。 CTR预估值。 然而,Facebook和Kaggle竞赛的思路是否能直接满足现在CTR预估场景呢?按照Facebook、Kaggle竞赛的思路,不加入广告侧的AD ID特征? 下面第三部分将介绍针对现有CTR预估场景GBDT+LR的融合方案。 3 GBDT与LR融合方案AD ID类特征在CTR预估中是非常重要的特征,直接将AD ID作为feature进行建树不可行,故考虑为每个AD ID建GBDT树。

    2.6K60发布于 2018-01-26
  • 来自专栏深度学习与推荐系统

    CTR预估模型有怎样的发展规律

    前深度学习时代 在深度学习还没有引入到点击率(Click-Through Rate,CTR预估之前,CTR预估的模型大概经历了三个阶段:逻辑回归(Logistic Regression,LR),因子分解机 深度学习时代 当把深度学习的方法引入到CTR预估中,可谓是百花齐放,这里举一些经典的网络,像16年发表的论文FNN [1],为了避免完全从随机状态训练Embedding,通过FM的隐层向量作为user和 由此可见,在深度学习时代,CTR模型的迭代发展也是在找一个更好的可以得到强表达能力的高阶特征的构造方面发展。 for Recommender Systems (Google 2016) [4][DeepFM] A Factorization-Machine based Neural Network for CTR

    99900发布于 2020-01-06
  • 来自专栏AI科技时讯

    CTR点击率预估论文集锦

    前言 CTR预估对于搜索、推荐和广告都是非常重要的一个场景,近年来CTR预估技术更新迭代,层出不穷。这篇文章将记录CTR预估著名模型的相关论文。以下按照年份整理。 1.2020年 (DFN). (UBR4CTR). DeepFM: A Factorization-Machine based Neural Network for CTR Prediction, IJCAI (CCF-A),出自华为和哈尔滨工业大学合作 Field-aware Factorization Machines for CTR Prediction, RecSys, 出自Criteo团队。 (HOFMs).

    1.4K20发布于 2020-09-29
  • 来自专栏深度学习与推荐系统

    多值类别特征加入CTR预估模型的方法

    我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embedding 矩阵相乘转换成多维稠密特征,如下图 1 所示: ? 上一篇文章稠密特征加入CTR预估模型的方法中又总结了稠密特征加入到CTR预估模型中的方法。 在CTR预估模型中,对这种多值类别特征的常用处理方法总结归纳如下: ▌非加权法 最常规的也最简单的是先对所有‘话题’集合进行one hot编码,然后按照图 1 方式对多值类别特征中的每一项进行稠密特征的转换

    1.9K00发布于 2020-01-06
  • 来自专栏SIGAI学习与实践平台

    CTR点击率预估之经典模型回顾

    CTR预估常伴有训练数据量大、特征高度稀疏、推断性能要求高等特点, 使得算法的设计多围绕这些特点来进行. 本文旨在梳理经典CTR预估模型的演化历程, 分为如下几个小节: 1.CTR预估的典型应用场景 2.LR(Logistic Regression, 逻辑斯蒂回归)在CTR预估中的应用 3.使用FM(Factorization 为用户在曝光数据集中的CTR预估, ? 为用户在点击后被转化的预估, 二者再与期望价格进行相乘, 便可以得到期望收益. 由此可见, 对CTR的精确预估(CVR同理), 直接能使得期望收益进行增长, 所以CTR预估的性能直接影响了推荐系统的整体性能, 对提高营收、社区活跃度等指标起到至关重要的作用. LR在CTR预估中的应用 在CTR预估中, 我们通常使用one-hot编码来对数据进行处理.

    3.4K21发布于 2019-05-23
  • 来自专栏圆圆的算法笔记

    一文读懂CTR预估模型的发展历程

    欢迎关注我~定期更新干货算法笔记和世间万物的学习记录~ CTR预估背景 CTR预估是搜索、推荐、广告等领域基础且重要的任务,主要目标是预测用户在当前上下文环境下对某一个候选(视频、商品、广告等) 发生点击的概率 CTR预估从最原始的逻辑回归模型,发展到FM、深度学习模型等,经历了一个不断创新的过程,其核心为如何设计、融合不同的特征交叉方式。 本文从FM和DNN开始开始,带你梳理CTR预估模型的发展历程,包括FNN、PNN、Wide&Deep、DCN、DeepFM、xDeepFM等一系列CTR预估模型和它们之间发展演进的关系。 从DNN和FM说起 CTR预估问题的核心是特征工程,而特征交叉又是特征工程最重要的一环。不同特征的组合构造而成的交叉特征对于点击率预估十分重要。 FNN和PNN的问题在于,由于采用了DNN结构,模型更倾向于提取高阶特征交叉,对低阶特征交叉提取较少,而后者在CTR预估中也是非常重要的。

    1.8K20编辑于 2022-09-22
  • 来自专栏深度学习入门与实践

    PaddlePaddle分布式训练及CTR预估模型应用

    今天刚写好第一个项目,用Paddle做广告CTR预估,来源于Kaggle的比赛Display Advertising Challenge, 感兴趣的读者往下看~(也可以留言期待的todo案例)   github 该数据包含数百万展示广告的特征值和点击反馈,目的是对点击率(CTR)的预测做基准预测。 ] + sparse_feature + [label] 38 39 return reader ---- 模型训练 网络结构 code: network_conf.py (只用到ctr_dnn_model

    1K10发布于 2019-05-25
领券