首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏实时计算

    揭秘阿里巴巴的画像

    平台场景目标群体及场景间买家差异性尚不明确,矩阵就是为场景中控解决这一业务痛点、提高场货分发效能而专门设置的算法研究主题。同时,矩阵也是用户增长和算法特征的核心数据。 鉴于矩阵如此重要且拥有诸多应用,其构建迫在眉睫。 我们主要围绕人、货、场、商4个维度构建,矩阵概况如图1所示。 矩阵同场景矩阵叠加,在构建场景目标用户、衡量场景差异性的同时,也能提高场景效能,有效引导目标流量,进而为各类业务场景的算法建模提供底层数据基础。 既然B类用户群体主要是企业和批发商,那么如何准确地描述矩阵呢?采购力就是突出的表征,采购力包含采购金额和采购频率,从采购力可以看出用户的经营规模和消耗能力。

    2.1K10发布于 2020-08-17
  • 来自专栏用户画像

    相似人群画像算法

    、二级分类、关键字、topic、阅读来源 negative 负画像(不喜欢),其他字段的含义与正画像一样 update_time 更新时间 cityCode或city 城市编码 3、相似人群画像也存在 中原有画像进行合并。 ,dic->list :param dimension_param_dic: 维度阈值 :return: 相似用户特征list :param cluster_profile:群体画像 :param cluster_dimension_feature:画像某个维度的特征 :param user_dimension:用户某个维度的特征 :param ratio :user的权重,公式为相似度/(相似度+10),区间为(1/3,10/11) :return:指定维度的画像 """ if user_dimension !

    2.6K61发布于 2018-07-19
  • 来自专栏张叔叔讲互联网

    画像平台人群创建方式-规则人群创建

    规则圈选是按照指定条件从画像数据中找到满足要求的用户并沉淀为人群的一种常见的人群创建方式。所谓的规则就是条件的组合,比如北京市男性用户,最近一周平均在线时长介于2到10分钟之间的中老年用户。 规则圈选的实现依赖画像宽表数据或者BitMap数据,其实现逻辑如图5-12所示。 画像宽表进行人群筛选,其实现逻辑是将人群圈选条件转变为SQL语句,借助ClickHouse引擎查询出所有满足条件的UserId并构建人群;当ClickHouse执行异常时会再次兜底从Hive表中筛选用户 每一个人群最终都会存储在Hive表和OSS中,但是不同人群创建方式优先产出的人群存储类型不同,所以画像平台需要支持Hive和OSS之间数据的相互转换。 ----本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    1.9K00编辑于 2023-10-18
  • 来自专栏张叔叔讲互联网

    画像平台人群创建方式-导入人群创建

    导入人群是将外部数据导入画像平台构建人群,主要有3种实现方式:文件导入、Hive表导入和SQL导入。 文件导入是将TXT、CSV等格式的文件导入画像平台;Hive表导入是指定源Hive表及导入字段,将满足条件的源表数据导入画像平台;SQL导入是Hive表导入的延伸,用户可以自由编写SQL语句,其运行结果最终导入画像平台 导入人群画像平台最常用的人群创建方式之一,其实现了将各类数据源沉淀为人群的功能,支持更灵活的人群创建方式,拓展了画像平台数据范围。 比如运营人员将某次活动中表现良好的用户导入画像平台并构建成人群,后续可以进行广告投放或者人群分析;数据分析师离线统计出了一批高价值用户,导入平台构建人群后可以直接提供给业务使用。 ---- 本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    90410编辑于 2023-10-19
  • 选址、调研所需周边人群画像怎么获取?区域人群画像分布API接入指南!

    在传统商业决策中,有多少资源因“目标人群画像模糊而被浪费?多少营销活动因缺乏精准人群触达而效果不佳?多少市场调研因无法获取核心画像数据,导致策略偏离实际? 区域人群画像分布APIAPI介绍:查询指定区域内得人群基础画像(共11类画像数据);从标准开发文档中的关键参数,即可看出其灵活性与实用价值:Body参数从Body参数可知,你可以自由选择不同季度(Q1~ 此外,你还能选择10类人群,获取其11类画像数据,涵盖基础画像(如年龄、性别)和各种偏好画像(如消费、兴趣),全面覆盖人群分析所需维度。 API获取指南及应用案例这个API主要来源是一个新上线的数据开放平台,提供很多人群、客流类 API(人群热力图、人群画像、客流趋势、客流画像等),比较小众,但包含的API还是很实用的。 若您的业务也需构建人群画像、区域洞察或客流分析等能力,“区域人群画像分布API”将是理想选择。

    33910编辑于 2025-10-17
  • 来自专栏张叔叔讲互联网

    人群创建的基础:画像标签BitMap

    ​上文提到了使用画像宽表可以便捷的创建人群,本文介绍人群创建所依赖的另外一种数据组织形式:标签BitMap。 使用画像宽表圈人的逻辑是从明细数据中找到满足条件的用户并最终构建人群,而使用BitMap进行圈人会对用户进行预聚合,在人群圈选时直接使用聚合后的结果进行计算。 BitMap以上特点都非常适合存储人群数据,也决定了其在画像平台的广泛使用。基于Hive标签数据表可以生成BitMap,图5-10展示了性别和常住省标签生成BitMap的示意图。 使用画像宽表还是BitMap要根据业务特点来决定。基于宽表中全量用户的明细数据可以实现所有的人群圈选功能,但是采用BitMap方案的人群创建速度相比宽表模式可以提升50%以上。 业界一般使用混合模式,优先通过BitMap进行人群创建,不适用的场景下兜底使用画像宽表进行人群圈选。采用混合模式要考虑对齐画像宽表和BitMap的标签时间,这增加了工程的实现复杂度。

    2.5K11编辑于 2023-10-17
  • 来自专栏张叔叔讲互联网

    人群创建的基础:画像宽表

    ​本节主要介绍人群创建所依赖的画像宽表的生成方式。为什么要创建画像宽表?基于原始的标签数据表进行人群圈选有什么问题?如何生成画像宽表?针对这些问题本节会给出详细解答。 画像宽表 本小节将首先介绍画像宽表的表结构以及在人群创建中的主要优势,然后通过一个示例介绍画像宽表的生成方式及优化手段,最后介绍画像宽表数据写入ClickHouse的实现方案。 支持跨时间的人群分析。有了标签历史数据便可以实现跨时间的人群分析,比如分析北京市男性用户在过去半个月的平均在线时长变化,基于画像宽表可以快速计算出分析结果。 兼容单日期分区。 本书技术方案支持多日期画像数据下的人群圈选等功能,自然兼容单日期下的各类功能。 画像宽表生成 画像宽表的表结构已经明确,那如何生成宽表数据? 如果画像平台用户对于人群圈选的速度没有要求,直接基于Hive表进行计算是可行的。

    1.7K20编辑于 2023-10-16
  • 来自专栏张叔叔讲互联网

    画像平台人群包常见应用场景

    应用方式:调研人员通过画像平台LBS人群圈选功能找到了几所高校附近出现过的用户,并结合用户年龄段等标签提高了用户圈选的精确度。生成人群之后,私信平台可以通过接口拉取人群数据并进行私信推送。 基于组合人群赠送优惠券应用背景:三八妇女节当天电商平台会给女性用户赠送商品优惠券,主要通过画像平台的规则圈选找出所有女性用户并构建人群,当用户位于人群中时则赠送优惠券。 应用方式:在画像平台上通过规则圈选创建女性用户人群A,通过文件导入的方式创建黑产用户人群B,通过组合人群的方式创建人群A与B的差集人群C。 应用方式:外呼团队在画像平台上创建外呼人群,并借助人群拆分功能将该人群按照25%、25%、25%、25%的比例拆分为4个子人群,在外呼平台导入4个子人群并配置不同的话术进行外呼操作。 应用方式:产品经理在画像平台上创建种子人群并申请该人群支持判存服务,客户端调用判存服务判断当前用户是否在种子人群中,如果存在则展示小游戏功能入口。

    1.3K20编辑于 2023-10-30
  • 来自专栏张叔叔讲互联网

    画像平台人群创建方式-明细行为圈选

    规则圈选中所使用的画像标签数据是离线计算出来的,大部分在计算过程中剔除了很多明细信息,仅保留了最关键的画像内容,即某日某用户的标签值。 虽然画像数据是浓缩精简后的核心数据,但在很多人群圈选场景中依赖行为明细数据,比如运营人员希望找出2022-08-15 10:00:00到2022-08-15 12:00:00之间通过手机客户端点赞了某篇文章的用户 在行为明细圈选时可以结合画像标签数据一起使用,比如找到在某时间段通过手机客户端点赞了某篇文章的北京市男性用户,可以直接关联画像宽表进行计算。 ----本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    1.5K40编辑于 2023-10-21
  • 来自专栏张叔叔讲互联网

    几张图告诉你什么是人群画像分析

    人群画像分析是对已经创建完成的人群进行画像分析,目的是从不同角度更深入地认识人群用户并挖掘其人群特点。 人群分布分析偏重人群画像标签值的占比分析,比如人群中男女占比分别为60%和40%;人群指标分析主要针对可量化的标签进行分析,比如人群的平均在线时长、平均点赞次数等;人群下钻分析是在某一画像分析维度的基础上再次基于其他画像维度进行分析 人群分布分析人群分布分析是计算人群画像标签上的分布占比数据,比如分析人群的性别分布,常住省分布,兴趣爱好分布等。 人群分布分析只能对人群进行最直观的画像分析,比如性别和常住省的占比分布。如果业务需要查看该人群中所有男性用户的常住省分布情况,那么需要深入到男性用户中进行更深层的画像分析。 人群对比分析人群对比分析通过对比两个人群画像分析结果,可以找出人群间的主要差异。

    2K30编辑于 2023-10-25
  • 时空API实测:区域人群客流画像数据快速获取

    公司市场部门要做人群客流调研做分析,到处找人群客流统计数据和画像数据,哪用那么麻烦?直接找相关API接口啊,分分钟获取数据。给市场同事搞定人群客流数据后,顺便写写分享出来,有相同需求的可以试试。 API中可选择10类人群、11类人群画像数据,涵盖基础画像(如年龄、性别)和各种偏好画像(如消费、兴趣),不同人群不同画像,满足多样人群分析需求,应用面挺广。 】便有8大类人群画像数据,囊括年龄、性别、职业等多维度,数据类型很丰富,就不一一展开,想了解具体参数去平台体验获取。 回到今天推荐的核心API:“区域人群画像分布”,API接口设计简洁易用,开发者可以快速集成到系统中,以下是关键步骤:1.注册与认证登录平台控制台,获取区域人群画像接口API Key,用于后续接口调用;2 ,若能深度开发或集成“区域人群画像分布API”至产品,即可获得多维度的深度人群洞察。

    46210编辑于 2025-07-15
  • 来自专栏大数据成神之路

    Doris在用户画像人群业务的应用实践

    大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 大数据真好玩 点击右侧关注,大数据真好玩! 版权声明: 本文为大数据技术与架构整理,原作者独家授权。未经原作者允许转载追究侵权责任。 编辑|

    1.8K20发布于 2020-12-08
  • 来自专栏图与推荐

    搜推广遇上用户画像:Lookalike相似人群拓展算法

    在《当推荐系统遇上用户画像:你的画像是怎么来的?》一文中,我们介绍了怎么通过TF-IDF的方式得到用户的画像。而在本文中,我们来聊一下在搜索、推荐、计算广告系统中“画像是怎么用的?”。 在互联网商业应用中,许多广告主在“搜寻潜”时,都会遇到如难以识别高潜人群、难于平衡成本与规模等问题。 而在数字营销的过程中,运营人员或者数据分析同学也是在根据已有的经验,通过用户画像的方式,扩展与历史转化人群相似的人群。比如,通过性别、年龄等筛选出化妆品的受众人群等。显然,这种方式有些粗糙。 举个广告的栗子,对于一个化妆品类广告主,需要对100万人投放自己的广告,但是根据经验或者画像只有10万的人群包,那么如何选取这100万,同时满足人群量级和转化(盲目选择可能存在无效用户)两个因素,就需要用到 图片引用来自参考资料1 Lookalike相似人群拓展方法主要有以下几种方式, 利用用户画像进行显式人群拓展:根据种子用户的标签(地理、兴趣、行为、品牌偏好等),利用相同标签找到目标人群; 利用机器学习模型进行隐式人群拓展

    5.1K40发布于 2021-05-31
  • 来自专栏张叔叔讲互联网

    一文读懂:画像平台人群包产出进阶之路

    本文将以规则人群为例,完整地描述人群创建耗时从十几分钟降低到秒级响应的优化进阶过程。 简单直接的解决思路实现上述需求的核心是构建如下SQL语句并找到所有满足条件的UserId,其中WHERE条件是什么取决于用户在画像平台上的标签选择和筛选配置。 为了满足Hive表形式的人群使用需求,后续还可以将人群BitMap落盘到人群结果Hive表中。 ClickHouse支持基于BitMap的人群创建,可以将画像宽表中的数据转换成不同标签的BitMap数据,灌入ClickHouse中之后可以借助BitMap的交并差操作实现人群创建。 图9-8展示了基于BitMap进行人群圈选的实现逻辑。本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    1.4K60编辑于 2023-11-04
  • 来自专栏小晨讲Flink

    附PPT下载|Doris在用户画像人群业务的应用实践

    01 PPT预览

    1K10编辑于 2022-03-10
  • 四力PLUS商家增长平台产品介绍

    数据驱动CaaS服务:方略围绕“人货场”提供大数据轻咨询(画像、潜客地图、选址、建模共创),输出可落地业务方案。 深度洞察看板-人群画像:结合方略标签产品化,支持省份/性别/年龄/学历/城市分布等画像洞察,开通需联系四力助理@罗芸冰(数据接入达标后开通)。 四力方略能力: 画像报告:标签洞察(基础信息、履历、生活态度、通用兴趣)、聚类工具(筛选特征-聚合-得出结论)、交付物示例(网瘾少年、雪田丽等画像)。 小程序黑盒诊断覆盖前端/安全/性能,含18项问题示例(某潮玩品牌); 行业报告多深度覆盖(日常/专项/定制),补充微信生态洞察; 方略轻咨询聚焦人货场,输出画像、潜客地图等大数据方案; 群聚类工具灵活(筛选-聚合-结论-示意图),含典型画像; 全城潜客地图支持栅格/围栏双模式,潜识别与赋分; 线下选址报告用有店栅格建模预测未开店址销量。

    7810编辑于 2026-03-31
  • 来自专栏华章科技

    数据解读“猫奴”的人群画像:都是哪些人在吸猫?

    经常线上云吸猫的朋友们可能会产生真的在吸猫的错觉,但其实,“为猫消费”的人群才算真正吸上了猫。 ▲猫吃jiojio都这么可爱 《2018年中国宠物行业白皮书》显示,真正吸猫的人群中,80、90后占比接近80%,占绝对优势。 中华田园猫的崛起实际上与吸猫人群获取猫的方式有关。其中,通过“捡的”和“领养”方式拥有吸猫资格的人占比过半。 ? “领养代替购买”的呼声已经兴起了很多年。 狗的体重从1磅到99磅(约为0.5-45kg)不等,大型猫的体重也仅在25磅左右(约为11kg),更适合单身人群及职场人群居所的大小。[3] ? 乌有之猫:“云吸猫”迷的认同与幻想[D].(浙江大学) [2] WikiHow. 如何让猫咪喜欢你.

    3.5K20发布于 2019-04-24
  • 来自专栏Coggle数据科学

    DF消费者人群画像—信用智能评分方案分享(top5)

    让参赛者在真实业务场景上使用数据;(2)可以交流多种想法,可以接触到企业内部真实脱敏的数据,让参赛者在真实业务场景上使用数据;(3)进一步提升信用评估方法技能,通过此次参赛可进一步提升参赛选手的对用户信用评分的技能,可以用在用户画像和黑产识别上 但还是期待更多的尝试,这次比赛的数据量并不是很多,考虑增加样本,来提高高质量的训练集容量,增加样本量可以防止过拟合,可以使模型的泛化能力更强;构建多重”UID“关注点不仅仅聚焦在呈现的一个用户的行为,可以聚焦用户相互之间的特征标签做信用评分

    2.1K20发布于 2019-09-12
  • 来自专栏华章科技

    互联网人群画像和你所不知道的真相

    而对互联网世界中不同人群进行类型识别和描绘的工作,也有了更简洁的说法——人群画像,或是用户画像人群画像突然成为互联网营销不可或缺的金字招牌。这个金字招牌的究竟是什么? 人群画像的经典构成要素 人群画像从字面理解,是把人群的情况用数据的方式描绘出来。人群画像和个体画像并不完全相同。千万不要混为一谈。 给个体画像,指描述不同个人的过程。 人群画像与个体画像有强关联,人群画像必须基于对个体的画像,但却高于个体的画像,体现为人群作为一个集群的整体特征。 例如,iPod生产商的人群画像显然是针对听音乐感兴趣的人,NB运动鞋厂则想对运动时尚人群画像人群画像与个体画像相似之处在于,两者都是对人的描述。 当然,这种跨设备的唯一身份识别的范围那就是极小极小了,因此不具备人群画像所需要具备的普遍性。 但问题在于,如果你希望得到某个人(或者是某人)的画像,你不太可能只依靠某一个互联网服务提供商就能完成。

    2K20发布于 2018-08-14
  • 客流类API实测:门店到访客画像数据获取

    这个API叫“门店到访客画像分布”,主要用于线下实体门店到访客画像统计和分析的,比较契合我们的产品功能需求,整体接入过程还是比较顺利,数据也满足要求! 一级业态枚举:餐饮,零售,生活配套,休闲娱乐,家庭亲子餐饮从Query参数可知,这个客流API可以获取指定月份、指定场景(门店)的到访客画像,涵盖基础画像(如年龄、性别)和各种偏好画像(如消费、兴趣) ,对实体门店的统计和分析的价值还是很大的。 一、在线获取1、在及刻开放平台首页右上角注册后,进行到控制台,查看已经订购的API和创建API Keys,用于后续接口调用;2、在能力中心页面找到“泛客流”栏目,找到“门店到访客画像分布”API;3、 二、接口调用示例API提供多种编程语言的SDK,以下以Python为例,展示区域人群画像接口的示例代码:import http.clientconn = http.client.HTTPSConnection

    33810编辑于 2025-08-21
领券