前言 ---- 由于去年下半年至今一直在进行标签体系建设,因此希望把标签体系建设过程中的碰到的问题以及建设的方法和阶段性的成果分享给大家。 共勉! 标签构建和画像画像 1. 标签生产引擎: 通过人机协同的方式,支持多种标签构建方式(规则、统计、算法、人工导入),实现用户360度全域标签。以产品化的方式进行标签体系全生命周期管理。 2. 这里面以如何满足业务单一场景、临时性需求为例进行展开说明: 目前初步搭建起了公有标签和私有标签两大体系。其中公有标签:面向公司通用的场景、具有普遍性、长期性的特点。 私有标签则是面向特定业务的特定场景下建立的,具有单一性、临时性 四、标签体系的阶段成果及后期规划 当前标签体系支持三大服务模式: 用户主动触发模式 。 未来展望分为两点: 技术突破,搭建实时标签体系。 目前的标签更多聚焦在离线行为数据,后期随着业务拓展,需要搭建起一套完善的实时、离线标签体系,支持两种混用, 业务赋能。
一、前言 之前有提到目前初步搭建起了公有标签和私有标签两大体系。其中公有标签:面向公司通用的场景、具有普遍性、长期性的特点。私有标签则是面向特定业务的特定场景下建立的,具有单一性、临时性。 部分读者对私有标签比较感兴趣,今天重点介绍一下。 ? 标签新增流程图一 二、背景 目前已有部分面向于场景开发的定制化标签,不适合作为公有标签对外提供服务。 若将该部分标签添加为公有标签可能对用户造成困扰,且以上标签贴合业务场景定制开发,不一定适用于其他场景,故针对这类标签需要作为私有标签,区别于公有标签对外提供服务。 需求方可提前跟标签PD联系评估标签的通用性,如果是特定场景下临时需求可以走私有标签,可由业务线的数据分析人员完成标签逻辑的开发。 b.私有标签质量如何保证。 五、收益 私有标签上线极大的提升了标签的服务效率,缩短了原有标签的开发周期。从以前平均下来单次标签开发需求从1周左右缩短至2天以内。
在数据的基建和应用层面,除了重视数据分析外,也越来越重视数据资产在更多业务场景中的应用,标签画像的建设和应用就是其中一类很常见的需求和期望。 从对业务的价值来说,标签和画像是类似中间层的系统模块,具体来说,数据资产本质上是一些采集、采购所获得的数据源,但企业希望在数据源的基础上,实现资产变现,而且不断扩大资产价值。 很多企业都意识到,这个中间层就是标签画像。 下面主要介绍了企业做标签画像的目的,重点阐述标签和画像的应用场景及应用流程,构建标签和画像体系的实操方法论,最后给出了行业案例。
当前标签体系支持创建标签方式有以下四种:1.基础标签 2.规则标签 3.逻辑标签 4.复合标签。 接着详细的介绍这四种标签的配置方式及实现形式。 2 规则标签 通过基础标签的交并运算生成的标签 新建新手法拉利司机的规则标签,将最近30天上传过驾驶证,且车型是法拉利 3 逻辑标签 基于业务的计算逻辑生成的标签 现有【性别-人工】【性别-算法】,依照优先级生成一个更准确的标签 二、规则标签 第一步:基础信息配置。包含:标签名称、标签描述、更新方式、更新频率. ? 三、逻辑标签 第一步: 配置标签基础信息,点击下一步添加规则; 预选标签类型,拖拽修改标签值优先级(仅支持同一类型创建逻辑标签) ? 四、复合标签 用户可基于已有标签的二次计算创建生产新标签。 运算结果设置支持用户对参与运算标签值、标签结果设置上下限,该部分设置可选填 复合标签结果值:限制组合标签结果值的上限与下限(对结果生效); 标签值设置:限制参与计算标签的上限与下限(对计算生效)。
用户标签的三大类型——从“发生了什么”到“将会怎样” 并非所有标签都生而平等。根据生成逻辑与技术复杂度,用户标签可分为三类,层层递进,构成完整的认知阶梯: 1. 三类标签对比表 维度 事实标签 规则标签 模型标签 数据来源 原始日志/业务库 事实标签 + 业务规则 事实+规则+算法 更新频率 实时/准实时 T+1 或事件触发 T+1 或流式计算 可解释性 极高 事实标签由数据平台维护,规则标签由运营配置,模型标签由算法团队迭代。 行业实战案例——标签体系如何驱动业务 案例1:电商平台(如京东、拼多多) 核心目标:提升GMV、复购率、用户LTV 标签类型 典型标签 应用场景 事实标签 最近购买品类、收货地址、支付方式 客服查询、 结语:标签不是终点,而是对话的开始 无论是电商的“猜你喜欢”,金融的“智能风控”,还是SaaS的“客户健康分”, 标签体系的本质,是把模糊的“用户”变成可操作的“对象”。
为什么要先介绍标签体系? 一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。 标签体系概览 ? 以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系。 ? 这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成 ? 一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。 以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。 ---- 标签体系构建的方法 标签体系的实施架构 标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。
在数据的基建和应用层面,除了重视数据分析外,也越来越重视数据资产在更多业务场景中的应用,标签画像的建设和应用就是其中一类很常见的需求和期望。 从对业务的价值来说,标签和画像是类似中间层的系统模块,具体来说,数据资产本质上是一些采集、采购所获得的数据源,但企业希望在数据源的基础上,实现资产变现,而且不断扩大资产价值。 很多企业都意识到,这个中间层就是标签画像。 下面这份PPT材料主要介绍了企业做标签画像的目的,重点阐述标签和画像的应用场景及应用流程,构建标签和画像体系的实操方法论,最后给出了行业案例。
为什么要先介绍标签体系? 一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。 标签体系概览 ? 以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系。 ? 这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成 ? 一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。 以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。 ---- 标签体系构建的方法 标签体系的实施架构 标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。
画像标签借助实体进行表达,比如用户的性别、年龄标签;商品的售价、种类、货源地标签;直播的分类、开播时间段标签;视频的风格、视频时长分段标签等,每一个标签都用于描述某个具体实体。 标签分类方式 本节主要介绍3种标签分类方式:按照生产方式、按照时效性和按照标签所属维度。本节最后给出了一个实际的标签体系分类示例。 1. 不同的实体类型对应的分类的维度也不相同,以淘宝为例,如果为商品实体构建标签体系,其所属维度划分方式可以分为:基础属性、供货信息、商家信息、市场信息等。 4. 标签分类示例 以上小节介绍了标签的3种分类方式,本小节以短视频业务场景为例给出一个具体标签体系分类示例,其具体内容如表3-2所示。 表3-2 短视频领域标签体系分类示例 标签名称 标签值示例 所属维度 离线/实时 生产方式 性别 男、女 基础属性 离线 统计 年龄段 小于18、18-30、30-60、大于60 基础属性 离线 统计
文章目录 一 标签系统体系架构 二 标签模型开发流程 三 标签模型计算逻辑 一 标签系统体系架构 1)、标签数据 标签管理平台中,每个标签开发时,首先需要在管理平台上注册(新建标签:4级标签和5级标签 ) 业务标签和属性标签 业务标签对应标签模型,每个标签模型就是Spark Application,运行程序可以给用户打上标签:TagName 模型表中存储数据:spark application运行时参数设置核心数据 二 标签模型开发流程 展示每个标签模型在实际开发时主要流程: 1)、标签管理平台新建标签 123级标签 34级标签 设置相关属性,包含标签的属性字段的值和对应模型字段的值 标签模型对应Spark ”) 自定义外部数据源方式 3)、【DataFrame】业务数据结合属性标签数据,计算标签modelDF 不同类型标签,计算标签方式不同,分为三种类型,规则匹配类型标签、统计类型标签和挖掘类型标签 规则匹配类型标签 业务字段的值与属性标签规则rule匹配即可 统计类型标签 设计对业务字段的数据进行统计和对属性标签规则rule进行转换,打标签 挖掘类型标签 使用机器学习算法构建算法模型,使用预测值与属性标签规则整合
大家好,我是一哥,今天给大家分享一篇标签体系如何建设的干货文章,欢迎转发收藏~ 为什么要先介绍标签体系? 一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。 标签体系概览 以京东的标签体系中的京东超市为例用思维导图来拆解,后面我们会详细的介绍如何构建标签体系。 这里对京东超市标签拆解粒度到三只松鼠年货大礼包的实体级别,实际上各个公司的标签体系大致都是如下构成 一、二、三级分类体系都很好理解,参考京东超市的拆解,相信大家就会明白。 以上大致介绍了一下标签体系,那么我们接下介绍一下如何构建标签体系以及其构建过程中应遵循的一些原则。 标签体系构建的方法 标签体系的实施架构 标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。
标签类目体系的设计方法基于“树形结构的标签树”第一性原理,通过识别对象、同一对象数据打通、数据化的事物表达、构建数据类目体系、构建标签类目体系、前后台标签类目体系等步骤实现完整的数据资产构建过程。 五 构建标签类目体系 梳理完企业原始积累的数据类目体系后,需要根据业务场景需要,设计标签及标签类目体系。标签类目体系的设计过程,比数据类目体系更为复杂。 一般当标签量超过50个,业务人员要查找或使用标签就有麻烦,数据管理员要管理数据、标签也会存在障碍。因此需要一种分类机制来对标签进行系统分类。 标签类目体系由根目录、类目体系、属性标签组成。 不变的只有按照真实业务、管理需求来构建标签类目体系的思路方法。 六 前后台标签类目体系 在构建完企业完整的标签类目体系后,需要将标签类目体系进一步加工为前后台类目。 数据资产设计师或管理员可以创建、维护后台标签类目体系,其他人员可以查看类目体系,但不能随意修改。后台标签类目体系比较稳定,是对人、物、关系各类对象的本质描述及描述属性的普适分类。
一、评估标签质量 1、业务背景 基于标签对业务进行精准分析,从而影响运营思路和产品迭代的节奏,进而带来非常高的商业价值,但是这里需要对标签的质量进行评估,假设标签的覆盖场景非常低,而且准确度低,同样也会反向影响业务 通过在标签的使用过程分析和评估,不断优化标签的质量,形成完整的管理周期,这样才能发挥更高的业务价值。 3、准确度 标签的准确度是在整合周期中最关键的,在给对象打上标签后,需要准确获取对象的各项数据,提供基准的分析。 二、标签基础应用 1、贴标签 给一个用户贴标签的过程是非常复杂的,这里通常需要依赖现有成熟的标签体系。 例如新注册的用户或者长期不活跃的用户,如何获取精准的分析,从而为运营提供激活用户的策略: ? 2、标签查询 基于对标签的选择,和标签值选取,生成数据查询的条件,圈取数据包,这是最常使用的手段。
这些类都是什么,彼此之间有何联系,就构成了标签体系。标签体系的设计有两个常见要求,一是便于检索,二是效果显著。在不同的场景下,对这两点的要求重点是不同的。 一般来说,设计一个标签体系有三种思路: 结构化标签体系 简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告主开喷时比较好用。 性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。 下图是Bluekai聚合多家数据形成的半结构化标签体系: 当然,标签体系太过混乱的话,投放运营起来就比较困难。 面向品牌的结构化标签体系,设计的好坏似乎并不太重要;而彻底非结构化的标签,也没有太多设计的需求。产品狗们碰到的难点,往往是如果设计合理的半结构化标签体系以驱动广告的实效。
标签体系,绝对是数据分析年度工作中,最值得摆在开年做的。因为它和所有工作都有关系,经营分析、投放分析、用户画像、推荐策略、商品运营……都得靠标签带动。 标签体系做得好,后续分析才有足够多素材,才能积累经验。标签体系做得差,白费功夫不说,后边做深入分析的时候还没有依靠。 那么该如何做呢? 今天简单分享一下 一、标签体系常见错误 最常见的错误,就是:标签就是一箩筐,啥玩意都往里装。 经常有人洋洋得意跟我炫耀:“陈老师,我们好厉害,光用户标签打了3000多个……” 这时候你只要反问他: 3000个标签,业务用上的有几个? 3000个标签,产生价值有多少? 认真了解业务需求以后,就会发现:大面积打标签,根本没必要。把大面积的标签一股脑怼给业务用,更没必要!提供少而精的标签,培养业务使用习惯,循序渐进建成完整体系,才是项目成功的关键。
三、用户画像标签体系的建立 1、什么是标签体系 用户画像是对现实用户做的一个数学模型,在整个数学模型中,核心是怎么描述业务知识体系,而这个业务知识体系就是本体论,本体论很复杂,我们找到一个特别朴素的实现 2、标签体系结构 标签体系可以归纳出如下的层级结构。 ? (1)原始输入层 主要指用户的历史数据信息,如会员信息、消费信息、网络行为信息。经过数据的清洗,从而达到用户标签体系的事实层。 3、标签体系结构分类 一般来说,设计一个标签体系有3种思路,分别是:(1)结构化标签体系;(2)半结构化标签体系;(3)非结构化标签体系。 性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。 ? (2)半结构化标签体系 在用于效果广告时,标签设计的灵活性大大提高了。 通过统一产品类目和属性体系和统一的用户画像标签体系的建设,为用户标签的应用提供支撑。
一、标签简介 标签概念 标签,最初用来对实物进行分类和标记,例如标明物品的品名、重量、体积、用途等简要信息。后来逐渐流行到数据行业,用来标记数据,对数据快速分类获取和分析。 基于动态的规则配置,经过计算和分析,生成描述的标签,也就是规则标签。 三、标签管理体系 层级分类 标签管理的基本手段,通常以行业来分:金融,教育,娱乐等;通过多级分类细化管理。 基础标签 即数据的关键标签,特点精确扁平,不可再细分,用来精确的描述数据,类似元数据。 例如标签「性别」,标签值「男.女.未知」,这种典型通过罗列字典来描述的场景。 四、标签生产流程 1、基础流程 ? 标签库 通过标签库,管理复杂的标签结果,除了复杂的标签,和基于时间线的标签变,标签数据到这里,已经具有相当大的价值,可以围绕标签库开放一些收费服务,例如常见的,用户在某电商APP浏览某些商品,可以在某信息流平台看到商品推荐
关于标签准确性你是不是会想到几家公司?没错,移动、联通、电信三大运营商的标签体系先天性的准确到可怕。 (不敢再多比比了) 为什么会被画像标签体系弄炸了? 这边按照处理过程、标签的获取方式标把标签分成了3种类型,事实标签,模型标签,预测标签。不同类别的处理方式是不一样的。可看下图: ? 事实标签:直接从原始数据中提取,比如性别,年龄,常住地,上网时段等等。 模型标签:注意这里的模型指的不是机器学习模型,而是类似于品类偏好、RFM模型之类的。 预测标签:预测标签有时候会结合事实标签一起使用,比如某个用户并不会注册性别消息(没有实名制),或者说他填报了一个假的性别,这时候可以通过聚类分析,相似度计算,看与这个用户相似的一部分人用户行为表现(这一部分人已知性别 但这又是一个非常重要的任务,不管是后面的精准营销亦或是个性化推荐,第一步都是需要有一个完整、准确的用户画像标签体系,最后与业务线对接做验证再调整现有的标签体系形成完美的闭环。
标签的IT架构与CRM、数据中台有什么联系? 在搭建用户标签体系的过程中,除了数据收集、数据清洗、数据加工之外,标签的管理也是非常重要的一环,合理的管理可以最大化的发挥标签的价值。 标签的管理,具体都是有哪些内容需要管理呢?主要包括以下两个方面:标签分类体系和标签内容信息。 03 标签体系分类 标签分类是为了从海量的标签中找到想要的标签,使得所有的标签形成有机整体。 主要包括:【标签基本信息】、【标签的数据表信息】、【标签加工信息】、【标签的质量信息】、【标签的应用信息】 05 标签建设的整体架构 一个完整的标签建设项目包括标签加工、标签装载、标签管理、标签服务四个环节的 06 标签全生命周期运营管理体系 标签是打通数据后台与渠道系统之间的重要载体,标签系统上线后会迅速过渡到跨部门、跨系统的标签运营管理阶段,所以做好标签的创建、审批、开发、上线、应用、评估、共享、变更、下线等全生命周期流程管理规范是一项非常重要的工作 即将标签体系作为检索条件,检索标签 标签关键词搜索。支持用户通过搜索的方式直接找到标签 标签列表。呈现检索或者搜索后的标签列表,列表可呈现必要标签信息 标签排序。
上期分享了数据分析师必备能力:打标签。这次分享一个更高级能力:构造标签体系。在提升能力的顺序上,当然是先会打一个标签,再会搞整个体系了。 一、什么是标签“体系”? 围绕一个业务场景,实现业务闭环操作的若干个标签组合,称为标签体系。之所以需要标签体系,是因为单一的标签没办法满足闭环操作的需求。 这就是围绕:发信息促成用户消费场景下的,一个简单的标签体系(如下图)。 二、为什么需要“体系”? 一来,单独的标签很难发挥作用,发挥作用需要考虑多个标签。这就需要体系化设计。 所以,为了保住饭碗为了有效推动业务工作,更得体系化设计了。 三、如何梳理标签体系 有了梳理指标体系的经验,再来梳理标签会很容易,它分为五步: 第一步:明确业务场景(有明确的对象、目标、流程)。 有一个明确目标,就能想各种办法迭代升级,推动标签从简单的规则计算,向建模方向发展。 而以上三点,也是标签体系的优势:效率高、可积累经验、可迭代升级。所以想做得深入,一定是需要建标签体系的。