首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏张叔叔讲互联网

    人群数据如何对外输出

    Hive表的方式就是将人群结果表告知业务使用,此时需要注意以下3个问题:权限问题:如果所有人群的结果都存储在同一张Hive表中,需要严格进行权限控制。 拥有数据表权限的用户理论上可以读取到所有人群下的用户数据,如果部分人群数据比较敏感(比如充值用户人群、日活用户人群),就需要严格控制Hive表的读取权限。 数据锁问题:用户在读取人群结果表数据的同时可能遇到人群数据正在写入的情况,这个时候会出现数据锁问题,可以通过show locks查看锁表情况。 数据表下线问题:当人群结果表应用到数据生产和分析任务中时,人群表的更新或者下线会对下游依赖产生影响。 当调用方通过接口拉取人群数据时,画像平台侧首先从OSS读取人群BitMap数据,然后通过人群BitMap接口返回给调用方。

    72150编辑于 2023-10-23
  • 来自专栏机器学习、深度学习

    人群分析、人群计数 开源代码文献及数据

    Scale-adaptive Convolutional Nerual Network https://github.com/miao0913/SaCNN-CrowdCounting-Tencent_Youtu 人群分析 Network for Dense Crowd Counting Caffe: https://github.com/davideverona/deep-crowd-counting_crowdnet 人群数据库 Novel Dataset for Fine-grained Abnormal Behavior Understanding in Crowd 人群异常行为数据库:https://github.com /hosseinm/med Panic,Fight,Congestion,Obstacle ,Neutral 人群异常检测 Anomaly Detection and Localization in Crowded Scenes 数据库 http://www.svcl.ucsd.edu/projects/anomaly/ 人群分析 Deep Spatio-Temporal Residual

    2.1K70发布于 2018-01-03
  • 来自专栏数据科学和人工智能

    数据集 | 贷款人群信息数据

    下载数据集请登录爱数科(www.idatascience.cn) Lending Club平台2012-2018年的贷款数据。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源 来源于Kaggle。

    1.2K10编辑于 2022-03-30
  • 来自专栏张叔叔讲互联网

    人群LookALike以及挖掘人群的创建思路

    人群LookALike是给定种子人群,然后通过技术手段找到与该种子人群相似的用户群体。 使用画像数据、行为数据、消费数据等为每一个用户构建特征向量,构建过程依赖数据编码、数据归一化等手段。 借助画像数据对种子人群进行特征分析并找出其主要标签特征,比如种子人群标签特征趋向于:性别男、年龄30至40岁、兴趣爱好-军事,那么可以把非种子人群中的所有30-40岁之间爱好军事的男性用户圈选出来作为目标人群 图片基于分类算法计算相似人群。把种子人群当作正样本,其他非种子人群(或者其他人群)当作负样本,通过训练分类模型计算出满足条件的用户并构建目标人群人群挖掘的思路是先找到训练样本(种子人群),然后通过LookALike的思路扩展种子人群。该方式与人群LookALike不同的是,人群挖掘的结果中可以包含种子人群中的用户数据

    1.9K30编辑于 2023-10-22
  • 来自专栏张叔叔讲互联网

    画像平台人群创建方式-规则人群创建

    前两种执行方式生产的人群会优先产出BitMap并存储到OSS中,第三种方式生成的人群数据直接存储在Hive表中。为了实现人群数据的持久化存储和便捷的接口调用,人群数据最终会存储在Hive表和OSS中。 Hive表中的人群数据主要用于离线数据分析场景,很多业务使用人群之后需要通过人群结果表进行效果分析。图5-13展示了人群结果表的表结构设计,人群crowd_id作为分区键,分区下包含该人群所有用户。 OSS中的人群数据主要应用在通过接口获取人群数据的场景下。人群数据压缩为BitMap并存储到OSS中,一亿人群大小在100M左右,通过接口可以在几秒内获取到人群结果。 、上传到HDFS以及加载成Hive表三个步骤,该过程与第3章中通过文件导入创建标签类似。 相关代码和步骤本章不再赘述,可以参考第3章中对应内容。----本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。

    2K00编辑于 2023-10-18
  • 来自专栏张叔叔讲互联网

    画像平台人群创建方式-导入人群创建

    导入人群是将外部数据导入画像平台构建人群,主要有3种实现方式:文件导入、Hive表导入和SQL导入。 图5-20展示了3种导入人群的可视化配置页面。 不同用户配置导入人群时涉及的数据表不同,要严格校验用户对数据表是否有读权限,防止发生数据安全事故。 Hive导入和SQL导入方式创建的人群数据直接存储到Hive表中,后续需要通过HiveToBitmap将人群数据写入BitMap并存储在OSS中。 导入人群是画像平台最常用的人群创建方式之一,其实现了将各类数据源沉淀为人群的功能,支持更灵活的人群创建方式,拓展了画像平台数据范围。

    90610编辑于 2023-10-19
  • 来自专栏大数据智能实战

    基于C3Framework开源人群计数框架的测试

    C3Framework是一个开源的人群计数框架,在进行代码复现的时候,进行单张图片的测试。 1. C3Framework中的算法 根据官网介绍,在该框架中集成了若干个模型,其中有些模型的复现效果并没有论文上来得好。 Method WE UCF50 MCNN (RGB Image) TBD TBD AlexNet (conv5) TBD TBD VGG-16 (conv4_3) TBD TBD VGG-16 (conv4 _3)+decoder TBD TBD ResNet-50 (layer3) TBD TBD ResNet-101 (layer3) TBD TBD CSRNet TBD TBD SANet TBD TBD C3Framework中的算法测试 撰写单个图片的测试代码如下,在该代码中同时进行了MAE和MSE的计算。 ? 以数据集中的第一张图片来测试: ? 其原始的人群密度图如下: ?

    90120发布于 2019-08-01
  • 时空API实测:区域人群客流画像数据快速获取

    公司市场部门要做人群客流调研做分析,到处找人群客流统计数据和画像数据,哪用那么麻烦?直接找相关API接口啊,分分钟获取数据。给市场同事搞定人群客流数据后,顺便写写分享出来,有相同需求的可以试试。 , 2:工作人群3:常驻人群,4:年轻群体居住,5:年轻群体工作,6:高净值人群居住,7:高净值群体工作, 8: 居住迁入迁出, 9: 工作迁入迁出,10: 常驻迁入迁出data_typeinteger 不像很多固定时间和区域的接口一样,它可以自由选择不同季度(Q1~Q4)、多种网格大小(100、200、500、1000)面积下的区域,想看哪里的人群画像就圈哪里,还能追溯历史数据,适配各种数据精准化需求 API中可选择10类人群、11类人群画像数据,涵盖基础画像(如年龄、性别)和各种偏好画像(如消费、兴趣),不同人群不同画像,满足多样人群分析需求,应用面挺广。 ,各类人群的画像数据基本都有,若能深度开发或集成“区域人群画像分布API”至产品,即可获得多维度的深度人群洞察。

    46510编辑于 2025-07-15
  • 来自专栏机器学习、深度学习

    人群密度估计

    Counting Varying Density Crowds Through Attention Guided Detection and Density Estimation CVPR2018 本文针对人群密度问题 将 检测方法和回归方法结合到一起,以此来提升人群密度估计精度 人群密度估计问题目前主要的方法有基于检测的和基于回归的方法。 在人群密度小的时候,基于检测的方法效果更好。在人群密度较大的时候,基于回归方法的效果比较好。 ? ? 本文的思路就是将 检测方法和回归方法结合起来,各取所长。

    1.5K40发布于 2019-05-26
  • 来自专栏用户画像

    相似人群画像算法

    一、数据源 1、相似人群数据存在TDW库中,数据字典说明: CREATE TABLE sim_people_tdw_tbl( uid STRING COMMENT 'reader id', ,格式为用户编号:相同阅读量,相似用户之间以逗号分隔 sim_num BIGINT 相似人群的人数 update_date string 数据日期 2、基础用户画像存在MongoDB中 Image [ 相似人群画像也存在MongoDB中 QQ截图20180719095235.png 二、整体思路 由于TESLA集群无法直接操作MongoDB,需要将TDW里面的用户画像数据,通过洛子系统导出至HDFS :param all_uid:用户的编号列表 :type batch_num: int """ rs = {} # 数据库查询所有人群用户画像 om_users_basic_profile_map # print("dump basic profile %d records" % len(pac_all_users_profile_map)) # 数据库查询相似人群画像

    2.6K61发布于 2018-07-19
  • 来自专栏机器学习、深度学习

    人群密度估计

    该网络在几个常用的公开人群密度估计数据库上取得了不错的效果。 1 Introduction 拥挤场景解析的发展从简单的人群数值估计到 人群密度图估计,人群密度图可以提供额外的信息,因为同样数量的人可以分布在不同的位置,如下图所示 ? (MCNN) 的架构,我们观察到这种结构存在几个问题: 1)Multi-column CNNs 比较难训练 2)Multi-column CNNs 引入了冗余的网络结构,如表1 所示 3) density level classifier ,这样计算量比较大 4) 这些网络用了很大一部分参数用于 density level classification,用于密度图估计的参数占小部分 3 不同数据库真值密度图的生成 3.2.2 Data augmentation 这里我们做了一些数据增强来增加训练样本的数量 3.2.3 Training details 损失函数如下: ?

    1.7K30发布于 2019-05-26
  • 来自专栏生信技能树

    Illumina首款东亚人群数据芯片ASA看这里哦

    Illumina之前推出的 GSA(Global Screening Array) 芯片获得了较大成功,此次主要基于东亚及东南亚人群数据开发了高通量芯片ASA(Asian Screening Array )用以低成本大规模推动人群分型。 (图二) 图一显示了ASA芯片标记的选取数据主要来源:中国、日本、韩国、蒙古国、新加坡等东亚及东南亚人群数据,其骨架基于9000个上述人群全基因测序数据获得,筛选出了共大约60万个标记。 不难发现ASA-CHIA芯片标记数据利用更充分,也更适合亚洲人群。 ? (图三) 那么ASA-CHIA SNP芯片有哪些用途呢? 1. 追溯祖源,并利用祖源区分不同地区或名族疾病易感位点; 3. 服务临床科研:绘制疾病精细化图谱,筛查遗传病、遗传性肿瘤、新生儿缺陷、罕见病等; 4.

    3.1K80发布于 2018-03-29
  • 来自专栏机器之心

    CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

    ,但获取大规模的人群行为标注数据成为了相关研究的发展瓶颈。 如今,合成数据集正成为一种新兴的,用于替代现实世界数据的方法,但已有研究中的合成数据集主要聚焦于人体姿态与形状的估计。它们往往只提供单个人物的合成动画视频,而这并不适用于人群的视频识别任务。 在这篇文章中,作者提出了一个适用于多群组人群行为的合成数据生成框架 M3Act。 数据生成 基于 Unity 引擎开发,M3Act 涵盖了多种行为类型的人群数据,提供了高度多样化和逼真的视频图像,以及全面的数据标记。 另外,与其他合成数据源相比,如 BEDLAM 和 GTA-Humans,M3Act 为模型训练提供了更大的性能进步,表明其更适合多人群体活动任务。最后,下表展示了不同模型在 M3Act 下的训练结果。

    36610编辑于 2024-06-04
  • 来自专栏机器学习AI算法工程

    受众行为分析与人群定向

    于是,以物拟人,以物窥人,才是比任何大数据都要更大的前提。明白了这一点,也就触摸到了人群定向的天花板–不可能百分之百精准。 如何从广泛的受众中提炼目标人群呢? 正是依靠受众行为分析。 相似或不相似的描述是基于数据描述属性的取值来确定的,通常是用各对象在多维空间中的距离来表示。 定义3:受众聚类模型 ? (3)通过随机抽样和划分技术,使得CURE算法能够处理超大规模的数据,以加快聚类算法的执行效率。 继续前面的例子,已有受众A: ρ1={1,0.75,0.8,0.1,…},若还有受众B: ρ2={2,0.78,0.81,0.2,…},受众C: ρ3={3,0.77,0.82,0.1,…}等等。 这个人群就是经过多道工序处理之后,数据挖掘工最终给我们淘出的亮灿灿的金子。

    2.5K70发布于 2018-03-14
  • 来自专栏机器学习、深度学习

    人群计数--Mixture of Counting CNNs

    of CNNs Specialized to Specific Appearance for Crowd Counting https://arxiv.org/abs/1703.09393 本文是人群计数的 ,不是人群密度估计。 这里主要的思路是针对不同场景的 scale and congestion 造成图像块的 Appearance 差别很大,这里我们使用多个小 CNN 来估计总人群。 另外适应一个大点的 CNN 对 图像块进行分类,这种分类主要依据人群密度大小。类别的概率作为每个小 CNN 的权重。 Appearance 的差异性 ?

    71370发布于 2018-01-03
  • 选址、调研所需周边人群画像怎么获取?区域人群画像分布API接入指南!

    在传统商业决策中,有多少资源因“目标人群”画像模糊而被浪费?多少营销活动因缺乏精准人群触达而效果不佳?多少市场调研因无法获取核心客群画像数据,导致策略偏离实际? 此外,你还能选择10类人群,获取其11类画像数据,涵盖基础画像(如年龄、性别)和各种偏好画像(如消费、兴趣),全面覆盖人群分析所需维度。 返回响应参数从返回参数中可见该API的数据丰富度——仅基础画像就包含8类分布数据。对于有真实人群画像统计与分析需求的企业和产品而言,该接口能大幅节省调研时间与人力成本。 API获取指南及应用案例这个API主要来源是一个新上线的数据开放平台,提供很多人群、客流类 API(人群热力图、人群画像、客流趋势、客流画像等),比较小众,但包含的API还是很实用的。 location": "113.943,22.535", "data_type": 1})headers = { 'token': '5b139c8cd617c24965401965a9fdc6e3'

    34410编辑于 2025-10-17
  • 来自专栏深度学习与python

    3人群定位 × 5 种赋能手段,企业全员数据能力提升指南 | 极客时间企业版

    数据标准混乱,各部门自成体系,缺乏统一的数据定义、分类和编码规范,导致数据整合、共享和交互困难,阻碍数据资产的有效管理。 数据质量缺少管控。 数据分散存储在不同系统和平台,缺乏有效的数据存储规划和管理,数据安全性和可扩展性差,易形成数据孤岛,限制数据的流通和应用。 规范化的数据将存储至企业数据平台,并开展数据开发处理工作,涉及数据平台开发、数据仓储、大数据技术以及流批一体等数据开发技术。 结合上述三个人群,极客时间设计了一套分层赋能培养框架,上述每一个层级的人员都有对应的痛点、能力和培养目标。 企业管理者。 第二是通过数据相关技术和企业数据能力提升,帮助提升业务创新能力。 数据人才培养方案 将企业内部人员划分为三个类别后,极客时间针对各个人群设计了适配的培养方案。

    37810编辑于 2025-05-21
  • 来自专栏无原型不设计

    Mockplus 的主要应用人群

    所以,Mockplus的适用人群是比较广的,只要你有产品(范围很广,可以是某网站,某功能,某个策划案,某个广告模型,某个创意等)模型的展示需要。

    84360发布于 2018-03-15
  • 来自专栏腾讯研究院的专栏

    VR行业生态及风险研究报告:潜在VR消费人群3亿

    其中提及VR潜在消费人群3亿人次,其中男性占比超60%。在VR应用场景方面来看,用户群体普遍对VR游戏发展抱有很高期望,单机、主机和网游用户均表示对虚拟现实游戏有较高兴趣。 据估算,网民中潜在VR消费人群约为3.44亿。 3.色情内容更具诱惑力和吸引力。由于VR所营造的沉浸感有着让用户身临其境的感受,利用VR特性制作的色情内容在视觉冲击力上比普通视频更强,因此对未成年人影响更大更恶劣。

    1.9K60发布于 2018-02-02
  • 来自专栏燧机科技-视频AI智能分析

    人群异常聚集识别监测系统

    人群异常聚集识别监测系统基于OpenCv+yolo网络深度学习模型,对监控区域内的人员异常聚集行为进行识别,一旦人群异常聚集识别监测系统OpenCv+yolo网络深度学习模型发现监控画面中出现人群大量聚集

    85330编辑于 2022-12-27
领券