首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习/数据可视化

    数据入门

    数据用户行为分析-入门篇 数据用户行为分析入门,主要涉及的知识点: 分析简介 产品优势 解决通点 分析作用 分析如何解决 数据来源 用户行为分析 如何描述用户行为 如何正确地标识用户 分析简介 分析是针对企业级客户推出的深度用户行为分析产品,有以下特点: 支持私有化部署 客户端、服务器、业务数据、第三方数据的全端采集和建模 驱动营销渠道效果评估 用户精细化运营改进 产品功能及用户体验优化 产品优势 私有化部署 基础数据采集与建模 实时多维度分析 PaaS 平台深度开发 ? 全面监控渠道获客的数量及质量 支持将分析结果添加到概览,使业务分析人员无需配置快速获得所关注的指标现状 数据来源 分析中的所有数据均来自于客户的自有数据接入。 分析主要支持采集客户的自有数据有三类,分别是前端操作、后端日志及业务数据(包括历史数据),接入的方式主要是有3种: 前后端SDK接入 外部数据导入工具 API导入 用户行为分析 常用名词 ?

    71820发布于 2021-03-01
  • 来自专栏机器学习/数据可视化

    数据用户行为分析

    数据用户行为分析-入门篇 数据用户行为分析入门,主要涉及的知识点: 分析简介 产品优势 解决通点 分析作用 分析如何解决 数据来源 用户行为分析 如何描述用户行为 如何正确地标识用户 --MORE--> 分析简介 分析是针对企业级客户推出的深度用户行为分析产品,有以下特点: 支持私有化部署 客户端、服务器、业务数据、第三方数据的全端采集和建模 驱动营销渠道效果评估 用户精细化运营改进 ,分析注册转化和付费转化 产品迭代无法量化 提供漏斗分析,帮助企业提升用户在产品上的转化 提供留存分析,帮助企业提高用户留存,用数据验证用户最喜欢的产品功能 用户运营不精准 锁定具有相似特征的用户群体 全面监控渠道获客的数量及质量 支持将分析结果添加到概览,使业务分析人员无需配置快速获得所关注的指标现状 数据来源 分析中的所有数据均来自于客户的自有数据接入。 分析主要支持采集客户的自有数据有三类,分别是前端操作、后端日志及业务数据(包括历史数据),接入的方式主要是有3种: 前后端SDK接入 外部数据导入工具 API导入 用户行为分析 常用名词 [007S8ZIlgy1gi20nq1jd8j312f0u07wh.jpg

    2.5K11发布于 2020-10-16
  • 来自专栏不温卜火

    机器学习在数据的应用

    主讲人胡士文先生是数据机器学习算法团队专家。如果需要视频的话可以私信博主,或者加交流群@群主。 在讲解之前,我们需要先简单介绍下数据 对于这个公司我们只需知道他是大数据分析及数字化运营解决方案的服务商,是To B型公司即可。除此之外,我们还需要了解产品和解决方案以及产品理念。 最后进行基于数据的分析与反馈: 最终需要看运行情况的最终结果。 此流程是一个不断迭代的流程(闭环) 二、机器学习在数据的应用 好了,终于开始了正式环节。 机器学习在数据的落地挑战 以用户预测的场景为例,去介绍机器学习在数据的落地的挑战。 自适应性 自适应性这个词可能有点模糊,不好理解。 从目前了解到的情况而言,就仅做一个预测来说,在一些数据基础和组织架构比较完善的公司最短大概两到三周能够去做一次预测。 回到的应用场景,我们要做的是一个产品化的功能。

    66530发布于 2021-08-24
  • 来自专栏机器学习/数据可视化

    数据2-用户识别

    数据2-如何正确标识用户 分析使用ID,即events表中的user_id和users表中的id,来对每个产品的用户进行标识,即ID等价于这两个用户名 ID是基于distinct_id 针对不同的客户端SDK已经做了处理。 参考资料官网:https://manual.sensorsdata.cn/sa/latest/tech_knowledge_user-7540285.html 登陆ID 登陆ID通常是业务数据库里的主键或其他唯一标识 ID 2 来识别新用户,将登录ID B同时写入users.first_id 、users.second_id 1、2:ID B与X关联失败,因为X和A已经关联;所以重新分配了一个ID(2) 当用户更换设备为 Y,未登录,则ID为3;一旦用户开始登陆,便会使用ID 1,因为A和X已经关联 ?

    1.8K10发布于 2021-03-01
  • 来自专栏机器学习/数据可视化

    数据3-用户关联及识别

    中如何进行用户关联 中关于几个id的整理: 1、如何确定神中的distinct_id:若用户没有登录,就是device_id(first_id);如果用户已经登录,则显示为登陆ID(second_id 2、users表中的3个字段 字段名 说明 id ID,对应events表中的user_id first_id 设备id,device_id second_id 登录id;登录后才有,也就是distinct_id 用户关联的注意事项 调用事项:用户登陆和注册的时候进行调用 调用规则:前后端在用户登陆注册的时候要同时调用;前端可能数据丢失,所以后端也要进行调用 先调用用户关联,再进行登录注册事件的采集 具体操作 客户端的用户关联 用户关联之后无法更改,采用ID(上图的第一个字段id来进行识别) ID在用户表中是id字段,事件表中是user_id字段 -- events表:查询某个用户的各种行为操作 select

    1.3K20发布于 2021-03-01
  • 来自专栏搜云库技术团队

    数据:在数据采集上的痛苦、幻想与失望

    作者:桑文锋,数据创始人兼 CEO,前百度大数据部技术经理 在这一年来接触了我个人接触了 200 家创业公司,发现都在数据采集上遇到多多少少的问题,我把它们归结为三类: 1、不知道怎么采,包括采集什么数据以及用什么技术手段采集 上面这三类问题让数据同学相当痛苦,进而有些幻想出现不用做数据采集的方案,结果做了些尝试后,进而是更大的失望。我这里对这三类问题的现状及应对之做一下分析。 这种方式只能是进行前端的数据采集,后端服务器和数据库中的数据,依旧是无可奈何的。即使进行前端的数据采集,也不能够进行细粒度的数据采集。 数据的事情归结起来就两点:数据采集和数据分析。可不能只看到数据分析但没看到数据采集。 目前我们分析针对这个问题,也是推出了埋点管理功能,对于每个采集点的数据收集情况,都能够做到监控,并且可以针对一些无效采集点进行禁用。总之是希望把这个问题尽量好的去解决。

    2.3K20发布于 2019-10-18
  • 来自专栏木东居士的专栏

    用户画像实践:标签生产引擎架构

    分享嘉宾:王琛@数据 编辑整理:冯露 出品平台:DataFunTalk 导读:用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。 本文就从标签体系建设的需求出发,阐述数据在设计标签生产引擎过程中所做的思考和实践。 基础数据流 下面主要讲讲技术问题,首先,在我们的理解当中,标签平台是一个中间层的服务,为前台服务提供一个数据支持,然后另外一方面,标签平台它所用到的数据其实是依赖于底层的基础数据平台的原始数据。 ? 这张图就展现了基础数据流平台的架构。数据流是从左到右的,最左边是所有的采集的方式,各种SDK采集了数据之后,经过数据接收系统、导入系统和存储系统,然后查询系统,最后展现。 2. 简化的数据模型 在这个流里,数据模型其实是非常简单的,基本会分成两大类:用户行为数据、用户属性数据。 ? 用户行为表: ?

    3.7K31发布于 2020-09-22
  • 来自专栏张叔叔讲互联网

    如何建设一个类似的平台

    数据是国内专业的大数据分析和营销科技服务提供商,目前已为众多商家提供了数据服务。 画像平台功能只是所有服务模块中的一部分,本节根据对外提供的技术资料,按照个人理解描述一个类似平台的构建过程。 产品介绍 数据定位是国内专业的大数据分析和营销科技服务提供商,公司致力于提供如下能力帮助企业实现全流程营销数字化。 数据目前提供的产品方案是“两云一台”。 表9-4 数据相关产品及适用场景 产品名称 主要功能点 应用场景 分析 报表(配置数据形成报表)概览(数据看板)分析(事件、留存、漏洞)书签智能预警分析 基于全渠道采集的数据,可以实现各类分析功能 AB测试 AB实验 配置AB实验,实验效果分析 广告分析 渠道分析渠道追踪 智能广告投放,投后效果分析 客景 客户全生命周期分析与运营工具 客户全生命周期管理 主要技术模块 的核心功能都直接或者间接依赖从业务侧收集到的各类数据

    1.1K30编辑于 2023-11-05
  • 来自专栏数据猿

    投稿 | CEO桑文锋:创业企业如何构建数据指标体系?

    对于从 BAT 等互联网公司出来的人,经历了数据分析的历练后,会有做事之前看数据的习惯。而对于毕业之后就创业,或者是产品经理和运营专员的新手来说,一般对于构建企业的指标体系比较困惑,不知如何下手。 在这一阶段,数据分析的价值比较小,你需要的是定性分析,通过用户访谈,直接确定产品的满足情况,并不需要在数据分析方面投入大量工作。 编者按: 本文作者桑文锋,数据创始人 兼CEO,前百度大数据部技术经理。 他结合自己多年的从业经历与大数据指标体系的构建的实践经验给出了非常实用的指导实施方案,相信对于庞大的创业群体和数据运营新手来说,这将是一篇非常具有参考价值的干货贴。 作者将在文章中深入阐述两套构建指标体系的方法,即关键指标法和海盗指标法,如果您在看过之后有所收获,也欢迎随时欢迎访问数据官网交流与互动。

    68460发布于 2018-04-19
  • 来自专栏小晨讲Flink

    附24页PPT | 标签生产引擎架构

    02 PPT预览

    62730编辑于 2022-03-09
  • 来自专栏开源

    数据迁移案例】3 年历史数据零丢失:数据成功迁移到ClkLog

    一、我们真的把数据迁进来了仅需要1个开发、几天时间,就能把多年数据完整迁进了ClkLog,并且还能继续分析。很多团队在考虑更换埋点分析系统时,都会卡在同一个问题上:历史数据怎么办? 二、一次成功的数据迁移:5天迁完3年数据,零丢失前段时间,我们帮一家已经使用主流埋点分析系统()3 年多的用户,完成了一次完整的数据迁移。 全程通过 ClkLog数据迁移工具,将用户原系统的历史数据完整迁移到ClkLog中,并实现了迁移后数据的正常分析使用。 迁移实施场景如下:1 个开发5 天时间(实际工作量可能会有偏差)3 年历史数据数据量:804万事件数据、381万用户数据 迁移后可在ClkLog 中直接查询、做分析、跑模型、继续服务业务通过本次迁移案例 ,我们可以相信,使用ClkLog数据迁移工具可以快速、稳定、安全地完成历史数据迁移,且确保数据可以继续使用。

    10210编辑于 2026-03-05
  • 来自专栏CDA数据分析师

    专访 | 数据CEO桑文锋:谁说大数据不需要「小而美」

    从前任百度大数据部门的技术经理,到今天神数据CEO,9年时间,桑文锋身上发生了许多变化。他笑称,这种变化从他的微信好友数量就能看出来。 大数据行业9年的历程带给他很多挑战,也改变了他的很多看法,但让他对自己所选择的道路愈加坚定了。前不久,数据拿到了400万美元的A轮融资,桑文锋与他团队的坚持得到了认可。 近期,CDA约访到了桑文锋先生,听他聊聊他对大数据行业的看法。 下文根据采访实录整理: ? 桑文锋 数据CEO CDA:大数据领域的创业公司日渐增多,您怎么看待目前市场中的机遇和挑战? 数据的定位是针对互联网公司的用户行为分析。有这么几个特点: 第一,提供私有化部署,用户可以把他需要的服务部署到自己的服务器上,数据不会出他自己的环境,打消了他们的安全顾虑。 第三,基于PaaS平台,一般比较常用的是SaaS服务,二者的区别在于SaaS很难进行二次开发和深度利用,它不提供接口,你也很难建模,而用户在PaaS平台可以进行二次开发和存储利用。

    1.3K80发布于 2018-02-24
  • 来自专栏互联网数据官iCDO

    【互联网数据官】数据宣布完成4400万美元C轮投资

    ,至此,数据成为国内用户行为分析领域,首家完成 C 轮融资的大数据公司。 数据联合创始人兼COO刘耀州回顾2017年提到,数据现服务付费客户500+,且于2017年120%完成业绩目标。在大金融、帆零售行业TOP50坐拥半壁江山。 且的客户黏性非常高,超40%的客户多个部门媒体都会使用分析。 刘耀州还提到,数据只会越来越重要,在帮助客户解决问题的同时,发现行业的头部客户更注重数据驱动,发展的也更快。 关于数据在不同行业的优势,刘耀州还认为,数据在互联网领域的优势是全端数据采集;在金融领域进行私有化部署;以及在泛零售领域着重实施标签体系与会员管理。 数据创始人桑文锋指出神数据迈向成熟的最重要一步是服务意识的形成。

    1.1K80发布于 2018-04-17
  • 来自专栏数据猿

    数据创始人兼CEO桑文锋:采集缺失折射数据建设之殇

    数据的一切出发点都是客户需求,而非人自己的意志。因此,相比于市面上大数据初创企业选择轻量的SaaS服务模式,数据采用“私有化部署+PaaS”的企业服务模式。 我希望,每位人成为中国的“PayPal黑帮”: 聚,能左右中国的数据发展进程; 散,能创建自己的独角兽王国。 2016年4月19日,数据宣布2600万的A轮融资,同时公布分析(Sensors Analytics,数据产品)新功能,这是首次对外正式发声。 2017年至未来,数据将持续深耕用户行为分析领域,将这一件事情做到极致,这是数据紧随并引领浪潮的内生动力。 2015年4月离职后创建数据,帮助互联网公司实现数据驱动。

    68260发布于 2018-04-23
  • 来自专栏数据猿

    数据24小时 | 数据完成A轮400万美元融资 IBM将建大数据学习社区

    届时,拥有滴滴 “大脑”之称的滴滴研究院的大数据专家们将会利用滴滴研究院在大数据挖掘以及深度学习领域的卓越技术,与 Udacity共同推出大数据算法竞赛项目。 大数据分析服务商数据完成A轮400万美元融资,红杉资本领投 成立于2015年的“百度系”大数据分析服务商数据正式宣布公司已完成A轮融资,由红杉资本领投,天使轮投资方继续跟头,此次融资金额达400 其公司主要服务于互联网创业公司,利用大数据技术针对他们的用户行为进行分析、研究,为企业提供决策支持。据悉,数据目前已经拥有40多家客户,其中包括短视频社区美拍以及弹幕视频网站AcFun等。 IBM大数据学院再合作,将与果壳网共建大数据学习社区 近日,IBM大数据学院在京签订战略合作协议,合作对象为果壳网旗下MOOC学院,双方将利用各自优势共同推广大数据的相关课程,从而构建大数据学习社区,为对此有兴趣的专业或非专业大数据学习者提供在线学习的平台 克而瑞发布房产大数据产品,让开发商深入了解购房者需求 近日,第三方数据公司克尔瑞发布了一项房产大数据产品,将利用其数十年在房产数据领域所积累的大数据信息,帮助开发商深入了解购房者的需求与行为。

    75380发布于 2018-04-19
  • 来自专栏BestSDK

    SDK全面支持海外数据规定GDPR,全程透明化可审计数据服务

    作为第三方数据分析服务商,数据一直以来将企业客户的数据安全和合规性作为公司最重要职责。    在整个行业全力提升数据安全和隐私保护之时,数据随着出海客户的增多,也在加大研发投入,全方位、系统性地响应新法令。   目前,数据已经全面升级数据保护和服务,一切工作已准备就绪。      对个人数据的应用应当是准确且可及时更新的;   确保数据的完整性和保密性;   数据为企业客户提供的全程透明化的数据服务,可审计跟踪。   虽然从技术可行性和执行成本来说,针对性删除数据的难度很大,但数据能做到以下两方面:   1.支持企业能够根据实际需求灵活地删除数据。 如报表、用户画像等,数据均可同步删除,防止任何后续的数据应用。

    1.1K30发布于 2018-07-30
  • 来自专栏SaaS加速器

    数据荣登 2020 IDC 中国 Fintech 50 强榜单|腾讯SaaS加速器·学员动态

    5 年来,数据已经覆盖细分行业 30+ 个,金融行业更是作为数据一直聚焦的重点行业之一,目前已积累中邮消费金融、国泰君安证券、海通证券、中原银行等多家头部金融领域付费客户。 作为中国用户行为分析行业技术与应用标准定义者,近年来,数据的产品理念已从早期的“单品极致”发展为“产品矩阵”,2020 年,数据根据数字化运营基础弱、应用浅、无闭环的三大痛点,以及促进用户活跃、 伴随着行业对于大数据应用范围的延伸,如今,数据不止提供用户行为数据分析工具,而是整合多种数据源,提供从数据分析到业务行动的全新数字化营销闭环解决方案。 并按照全新的 SDAF 运营框架,将分析、用户画像、智能运营、智能推荐、客景等产品,从一个个单独的产品重新整合成数据根基、分析云、营销云三大部分,旨在坚固的数据根基之上,从分析云中得到用户洞察 另外,针对金融行业数字化转型,数据已推出如《面向 2020:银行数字营销现状洞察》等报告及白皮书,未来,数据仍将坚持数据化道路,保持初心,在金融等所覆盖的 30+ 行业中持续发力,用数据驱动创造更多价值

    68520发布于 2020-11-23
  • 来自专栏开源

    用百度和做埋点为何 pv 差异很大?

    百度统计情况:ClkLog统计情况:一般来说,统计数据不一致的原因有:客户端埋点不准确、数据分析不正确、统计延迟、服务器崩溃、统计规则不一致等。 通过排查我们发现可能是因为单页应用的统计导致数据有巨大差异。 百度统计和埋点都有单页应用的配置项,但是默认是关闭状态,需要手动开启。所以单页应用埋点配置规则决定了页面浏览量的统计结果,极大可能就是页面浏览统计数据差异的原因所在。 ClkLog 是一款基于分析 SDK 的用户行分析开源软件,所以它也需要进行单页应用的配置。 ClkLog 与百度、的不同在于,ClkLog 相对比较轻量级,旨在让技术人员可快速在 10 分钟内完成私有化部署。

    40910编辑于 2024-08-29
  • 来自专栏数据猿

    金融科技&大数据产品推荐:分析——可私有化部署的用户行为分析平台

    ;感谢 数据 的产品投递 1、产品名称 分析(Sensors Analytics) 2、所属分类 金融科技·风控、征信、反欺诈、大数据安全、智能获客 3、产品介绍 分析(Sensors Analytics 不断调整站内推广策略,基于数据分析优化操作体验,提升核心投资产品的关注度。 5、产品功能 分析的主要功能如下: 第一,全端数据采集; 分析帮助企业构建夯实的数据基础。 根据业务分析需求,分析高效地采集散落各处的基础数据,永久沉淀企业数据资产。 第二,数据接入与存储; 多种埋点方式,确保分析提供给你适合业务需求的数据接入方案。 分析为企业打造专属数据仓库,全面数据采集覆盖、统一管理,实现多维度数据分析。 第三,提供 PaaS 平台。分析支持深度开发,开放接口,灵活扩展分析功能,整合打通三方系统等。 9、产品地址 分析:https://www.sensorsdata.cn/home/ 10、所属企业及介绍 数据(Sensors Data),隶属于网络科技(北京)有限公司,是一家专业的大数据分析服务公司

    1.8K60发布于 2018-04-24
  • 来自专栏SaaS加速器

    郑州银行评选数据为“最佳年度合作伙伴”|腾讯SaaS加速器·学员动态

    来源| 腾讯SaaS加速器二期项目-数据 ---- 近日,在郑州银行 2020 年度合作伙伴评选活动中,数据(腾讯SaaS加速器二期成员)获得了由郑州银行颁发的“最佳年度合作伙伴奖”。 此次评选是郑州银行对数据技术实力、解决方案的落地性、服务能力的全面认可,也是对数据银行事业部的信任与肯定。 经过充分严谨的选型与评估,综合考量安全性、专业性、技术实力等,郑州银行最终签约数据。 在合作中,数据将助力郑州银行数字化经营,强化数据在银行业务经营与提升用户体验方面的应用,提高管理的精细化程度,充分发挥数据价值。 凭借着在银行数字化解决方案领域的深厚积累,数据致力于稳健推动银行数字化转型,达到世界级的金融安全性与合规性。

    46830发布于 2021-03-16
领券