首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏全栈数据化营销

    数据分析实例:将恶性商户判断的准确度提高11

    某平台的算法团队开发了一个识别商家是否是恶性商户的模型M1,希望通过这种算法改变之前通过用户识别和人工识别异常数据的方式,改变人力成本高并且速度慢的情况。 通过用户举报和人工识别的方式判断,平台上的恶性商户的比率为0.2%,记为P(E),那么良性商户就是P(~E)就是99.8%;利用M1模型检测后发现,在已经判定的恶性商户中,由模型M1判定为恶性商户的人数占比为 (~E)*P(P|~E)] 通过以上分析,可以得到如下的计算数据: ? 通过计算,我们获得了当M1判别某个商户为恶性商户时,这个商户的确是恶性商户的概率是2.2%,这比之前判别的0.2%提高了11倍。 可能2.2%的概率并不高,但在实际情况下,被M1模型判别为恶性商户,说明这家商户做出恶性行为的概率是一般商户11倍,是非常有必要进行进一步更高精度的方式做检查的,而更高精度的检查的成本是很高的,因此M1

    49030发布于 2019-02-15
  • 纵向数据异常检测方法实证比较

    纵向数据异常检测方法的实证比较本研究报告探讨了纵向数据中的异常值检测问题,比较了官方统计中常用的方法与数据挖掘和机器学习领域提出的基于观测值距离或二叉划分树的方法。 研究方法通过将各种方法应用于涉及不同类型统计单元的面板调查数据来进行比较分析。传统方法相对简单,能够直接识别潜在异常值,但需要特定的假设条件。 此外,这些方法可以应用于多维数据场景。 方法特点对比传统方法:简单直接,可明确识别异常值,但需要满足特定假设条件现代方法:基于距离度量或树结构,提供异常概率评分,灵活性更强适用性:现代方法在处理多维数据方面具有明显优势结论研究表明,虽然所有异常检测方法都需要参数调优 ,但基于机器学习和数据挖掘的新方法在灵活性和多维数据处理能力方面优于传统统计方法,为纵向数据分析提供了更强大的工具。

    16410编辑于 2025-08-24
  • 来自专栏PingCAP的专栏

    使用 TiDB 作为 ZaloPay 商户平台核心数据

    ZaloPay 系统的商户解决方案 2020 年初, ZaloPay 上线了一个新功能,大约 1 亿的 Zalo 用户可以使用 ZaloPay 来转账、收款等。 我们要推动各种体量的商户使用电子钱包,包括餐饮业、旅游业等的账单支付。这正是“无现金化”电商所普遍追求的目标,我们都知道,实现复杂的交易业务,需要复杂且一致的系统架构。 TiDB 是一个支持 HTAP 工作负载的 NewSQL 数据库,旨在满足数据开发、数据可伸缩性、数据分析等需求。我最喜欢 TiDB 的一点是,我可以用 TiSpark 轻松分析数据。 Zalo 用户可以轻松下单产品,在群聊里分享账单,在家庭群组里发红包,通过商户的 Zalo 官方账号付款,商户类型覆盖了零售业、餐饮业、服务业、电商等多个行业。 商户拥有一个官方页面,就像脸书的粉丝主页一样,用户可以在 Zalo APP 中与商户网站上的产品进行交互,然后使用 ZaloPay 付款。

    1.7K21发布于 2020-07-03
  • 来自专栏月小水长

    如何用大数据可视化实证:明朝江西填湖广

    笔者编写了多级路径向量抽取算法,从文本数据库抽取构建了明朝所有人物的迁徙路径向量网络,并用Echarts 可视化得出结果如下:先来看明朝人物迁徙的总体情况,蓝色的点代表该地出生人物多于死亡人物,反之,红色的点则表示出生人物少于死亡人物

    31510编辑于 2025-01-04
  • YashanDB数据库应用在电商数据处理中的实证研究

    “YashanDB数据库应用在电商数据处理中的实证研究”是一个研究项目的标题,意味着研究主要聚焦于YashanDB数据库在电商行业数据处理中的实际应用。 YashanDB数据库简介- YashanDB 是一种高效的数据库管理系统,通常用于处理大规模数据,特别是在分布式环境中。 它可能具有高并发性、高可用性和分布式架构等特点,适用于电商平台这种数据量大、变化频繁的场景。2. 电商数据处理的挑战- 电商行业面临着大量的数据流,包括用户行为数据、商品库存、订单信息、支付数据等。 YashanDB 的事务管理功能能够确保数据一致性,避免出现错误订单状态。5. 实证研究- 实验设计: 在实证研究中,可能会设计一组实验来验证 YashanDB 在电商数据处理中的表现。 结论与建议- 根据实证研究结果,研究者会得出关于 YashanDB 数据库在电商应用中的效果评价,并提出在实际应用中的优化建议或改进方向。

    15710编辑于 2025-09-24
  • MVGC工具箱在神经科学实证数据中设计与应用

    MVGC工具箱在神经科学实证数据中设计与应用结合多变量格兰杰因果分析(MVGC)的核心原理与前沿进展一、MVGC工具箱的架构设计1.1 核心模块组成数据预处理模块 支持多模态神经数据的标准化(Z-score )、去噪(小波变换)和滑动窗口分割,适应EEG/fMRI等不同采样率数据。 样本量较大时O(n³)HQIC高频神经振荡分析O(n³)WAIC贝叶斯框架下的不确定性估计O(n²)MVGC工具箱 www.youwenfan.com/contentted/78122.html五、实证研究案例 5.1 神经振荡调控机制研究实验设计:经颅磁刺激(TMS)干预前额叶皮层,同步采集多模态神经数据。 因果发现算法 整合PC算法和FCI算法,处理存在未观测混杂因素的神经数据。开放科学支持 提供BIDS(Brain Imaging Data Structure)兼容的数据输入接口。

    30210编辑于 2025-10-29
  • 来自专栏数据猿

    外卖刷单用户与商户要注意了!大数据风控来了!

    而大数据的兴起与应用,为企业反欺诈提供了一条切实可行的道路,大数据风控随之诞生。 而大数据的兴起与应用,为企业反欺诈提供了一条切实可行的道路,大数据风控随之诞生。大数据风控是指通过运用大数据构建模型的方法对作弊和欺诈方进行风险控制和风险提示。 百度外卖资深研发工程师刘梦宇 在外卖业务中,除了存在用户刷单的行为,也存在各大商户利用刷单套取平台补贴、损害平台利益的行为。 针对这种风险,百度外卖的资深研发工程师刘梦宇为大家带来了以《商户风险控制的形态与策略》为主题的分享。 他指出,目前商户风控困难重重。 这首先表现在商户刷单中的利益链角色多、关系复杂;其次是他们的作案设备专业化、技术化;同时线下取证难,调查周期长,异常刷单行为接近正常行为。那么该如何防范呢?

    1.4K90发布于 2018-04-25
  • 来自专栏Geo

    深度解码GEO优化:基于数据指标的决策逻辑、学术实证与实战SOP

    根据普林斯顿大学、佐治亚理工学院等机构在《GEO:GenerativeEngineOptimization》论文中的实证研究,通过特定的内容策略,网页在AI搜索结果中的可见度最高可提升40%以上。 一、GEO优化的核心数据指标:从“流量思维”转向“引用逻辑”在GEO的语境下,数据不再仅仅是点击量,而是内容“可信度”与“语义权重”的量化体现。 通过数据分析,我们需要观察内容是否能够精准覆盖用户在不同决策阶段的提问。 2、四轮驱动:EEAT原则、结构化内容、Seo关键词规则、文献/数据精准引用这四个维度构成了GEO执行的坚实支柱。于磊老师作为Geo生态规范化的提倡者,坚决反对黑帽Geo和数据污染。 3、维护阶段:清理“数据污染”恢复信任①步骤:监测品牌关键词在AI语义空间中的负面关联词。②发现问题:部分企业曾尝试通过黑帽手段刷取热度,导致数据污染,被AI识别为“不可信来源”。

    29310编辑于 2026-03-13
  • 来自专栏DT数据侠

    数据行业薪酬居互联网之首;微信支付向商户开放数据 | DT数读

    过去一周,国际、国内的大数据相关公司都有哪些值得关注的新闻?数据行业都有哪些新观点和新鲜事?DT君为你盘点解读。 【公司·大数据】 1 腾讯 旗下微信支付宣布向商户开放数据 据南方日报,8月14日,微信方面宣布,商户通过手机可以及时、便捷地获取每日经营数据与相关分析。 目前,接入微信支付普通商户、普通服务商的特约商户可以申请移动端接收由公众号每日推送的经营数据。 DT君说:腾讯“主动”向商户开放数据,大招的背后,同支付领域越演越烈的一场纷争不无关系。 4 Apple 新专利获批,可通过手机检测血液数据 据36氪,本周初,苹果手机的一项“测算健康数据的电子设备”专利获批。 Consortium)的数据联盟,其目的在于为联网汽车的大数据创建一个生态系统。

    50200发布于 2018-08-08
  • 来自专栏数据猿

    数据24小时 | 雅虎承认“卖身”计划即将“告吹”;MBS数据库5800万商户数据遭遇泄露

    数据猿导读 浙大网新拟收购云计算服务商“华通云数据”80%股权;中南建设转型大数据领域,拟400万美元参投美国区块链公司PeerNova;浪潮集团与内蒙古战略合作,5大方面共同发力大数据……以下为您奉上更多大数据热点事件 二、数据存储服务提供商MBS遭遇黑客袭击,5800万商户重要信息泄露 近些年来,企业数据泄露事件多发,数据安全已经成为全球范围内都十分关注的问题。 上的数据仓库服务产品。 近日,大数据服务商浪潮集团宣布与内蒙古达成战略合作,双方将针对:成立巴彦淖尔市大数据中心、打造智慧城市、搭建大数据+创客中心、建设运营“爱城市”网以及建设人才实训基地这五方面达成深度合作,共同推动当地大数据产业发展进程 仙谷方面表示,未来将专注于发展互联网、大数据技术,实现企业的转型升级,其目标是成为一家集互联网、大数据于一体的运营平台。 ? 来源:数据

    74890发布于 2018-04-20
  • 来自专栏python全栈教程专栏

    mysql数据库(11):恢复数据

    (1)先登录 mysql -h localhost -u root -p  (2)查看数据库有哪些 show databases;  (3)新建一个空表text create database text ; ####新建数据库text ,等下导表用###  (4)删除数据库chuan drop database chuan;  查看还在不在? 不在了 show databases;  退出mysql后再执行以下命令恢复数据库中的表: mysql -h localhost -u root -p mysql  使用如下命令能够查看到表已经备份进去了 show tables;  如何恢复数据库呢? 以下将chuan.sql备份到text空数据库中 mysql -h localhost -u root -p text  再次登录查看,是成功将chuan这个数据库备份到了text数据库了。

    3.7K10发布于 2021-10-18
  • 来自专栏数据猿

    数据投融资周报(11月5日——1111日,共15起)

    来源:数据猿 作者:abby 本周大数据领域共发生15起投融资事件,其中包括7家中国企业、7家美国企业以及1家芬兰企业,涉及领域包括金融、机器学习、人工智能等多个领域,以下为您奉上本周投融资周报。 来源:数据

    57490发布于 2018-04-20
  • 来自专栏Java呓语

    11章、数据类型

    数字类型 MySQL 支持标准 SQL 中所有数据类型。 在 MyISAM/MEMORY/InnoDB和NDB表中支持BIT 数据类型,BIT 数据类型用于存储 bit 值。 当启用了严格模式,则会按照标准的SQL拒绝数据的写入。若未启用严格模式,则将数据裁剪并写入。 比如既有的数据中存在一些以空格结尾的数据,那么可以先将列改为CHAR保存。然后再修改为VARCHAR。 数据类型存储要求 磁盘上表数据的存储要求取决于几个因素。不同的存储引擎以不同方式存储原始数据。表格数据可能会被压缩,无论是列还是整行,都会使表或列的存储需求计算复杂化。

    2.3K20发布于 2018-08-21
  • 来自专栏Ywrby

    11-SpringMVC的数据响应

    SpringMVC的数据响应 页面跳转 方式一:直接返回字符串 直接返回字符串,此种方法会将返回的字符串与视图解析器的前后缀拼接后进行页面跳转 没有设置视图解析器的前后缀,直接返回字符串时就需要把跳转页面路径写全 ,即通过addObject方法像其中写入键值对,View对象负责展示数据(一般为JSP)通过setViewName进行指定 @RequestMapping("/saveFunction2") public ModelAndView save2(){ /** * ModelAndView 对象 * Model:模型,负责封装数据 * View:视图,负责展示数据 通过返回字符串进行回写数据 方法一:利用response对象直接回写数据 因为是通过SpringMVC调用方法,所以可以在方法的形参列表中加入HttpServletResponse对象,由SpringMVC 通过配置处理器映射器 直接通过SpringMVC帮助我们进行对象或集合的JSON格式转换,并进行数据会写。

    58720编辑于 2022-10-27
  • 来自专栏Devops专栏

    11. 数据库事务

    11. 数据库事务 前言 上一章节,我们学习了数据插入的批量操作,那么下面再来认识一下数据库事务。 数据库事务 1. 数据库事务介绍 事务:一组逻辑操作单元,使数据从一种状态变换到另一种状态。 为确保数据库中数据的一致性,数据的操纵应当是离散的成组的逻辑单元:当它全部完成时,数据的一致性可以保持,而当这个单元中的一部分操作失败,整个事务应全部视为错误,所有从起始点以后的操作应全部回退到开始状态 JDBC事务处理 数据一旦提交,就不可回滚。 数据什么时候意味着提交? 此时,mysql的数据如下: 通过上面的例子,只要有事务的控制,就算多条SQL变更数据,通过数据的回滚,就算出现了异常,也可以保证数据的原子性。 ,然后执行查询数据,确认查询的数据 5.1 首先在更新之前,查询当前的数据 5.2 执行更新数据,同时查询数据,确认是否能够查询 commit 之前的数据

    53810编辑于 2022-01-17
  • 来自专栏测试开发干货

    数据工厂平台11:首页收尾

    我在这里给大家继续更新下数据工厂章节。 接着来做这个首页的收尾部分。按照上节课的结尾,我们需要进行新导入组件的三个本地化配置。 1. 调整大小位置样式等 2. 经排查,是这个组件文件最底部的 js 引入 报错,所以删除掉这两行引入即可 现在报错问题解决了: 那么我们还剩最后一个 也就是最难的问题,即如何让数据生效? 大家跟住我的思路,不要打滑~ 1.先确定修改文案数据,是否可以影响图像角度变化 把最后一个改成了15%结果发现指针图像依然朝着原来85%的角度去了。 事情开始朝着不利于我们的方向进展了。 说下我的思路,我们可以写个js函数,来从后端接收数据列表。比如我们这4个统计图,我们从后端拿到数据[85,29,59,13],然后通过计算,得出角度。 然后通过jq/js ,强行更改这个loading-的样式内容数据,即可达到效果。

    1K20编辑于 2022-05-19
  • 来自专栏java开发的那点事

    11-Elasticsearch-logstash数据同步

    logstash数据同步 简介 集中, 转换和存储数据, logstach是免费且开放的服务器端数据处理管道, 能够从多个来源采集数据,转换数据,然后将数据发送到您最喜欢的"存储库"中 官网 https ://www.elastic.co/cn/logstash/ 下载地址 https://www.elastic.co/cn/downloads/logstash 功能 数据采集 以id或update_time URL以及数据库名称 jdbc_connection_string => "jdbc:mysql://192.168.246.1:3306/foodie-dev? jdbc_driver_class => "com.mysql.jdbc.Driver" # 开启分页 jdbc_paging_enabled => true # 每页数据量 clear_run => false # 数据库字段名, 大写转小写 lowercase_column_names => false } } output {

    90720编辑于 2022-10-04
  • 来自专栏数据小魔方

    数据地图系列11|PowerMap!(上)

    今天跟大家分享的是数据地图系列11——PowerMap! 这是一个excel的内置地理信息系统可视化工具,是微软PowerBI系列的四大工具之一。 powermap工具制作数据地图的好处是: 不用写任何代码、不用写一丁儿的函数语法、不用做任何复杂的数据转换。 今天要给大家介绍的案例是一家公司在18个中国城市的销售额(两个产品以及总销售额)。 ? 步骤: 1、打开数据文件 该数据文件除了主要数据外不应该有其他无关数据和无关信息。 ? 城市名称可以使用中文也可以使用英文。(软件会自动识别) 2、鼠标点击三维地图——打开三维地图。 点击前先选中所有数据区域,点击三维地图,在弹出的启动三维地图菜单中点击演示1,创建三维地图场景。 ? ? 如果你的数据里有详细的时间数据,它可以完成动态时间模拟过程,并且生成动态演示场景视频,嵌入其他演示文稿中,实现动态演示。

    2.3K40发布于 2018-04-10
  • 来自专栏深度学习与python

    携程火车票非用户端AB实验的分流算法

    通过实证分析,该算法一方面有效的提升了商户端实验在多指标下的分流效率;另一方面,相比于使用先验知识进行分流,显著降低了实验组之间的流量交叉。 (如学校、商业区、城市)内的用户施加不同的营销策略,因此活动主体和分流单位是商户,需要进行非用户端分流实验,且分流过程中为了防止用户之间相互影响,还需要尽可能避免参加相同活动的商户同时被多个用户看到的情况 从排序序列的第 1 个位置开始,每隔个实体抽取 1 个,形成第 1 个桶(如抽取 1,6,11,... 号商品);从第 2 个位置开始重复上述操作,形成第 2 个桶(如抽取 2,7,12,... 下述实证分析使用的是基于“总值”的相对差异。 4.3.2 实证指标评估 图贪心分流VS先验随机分流——实证指标对比 图贪心分流和先验贪心分流的实证指标对比见上表。

    33710编辑于 2025-07-02
  • 来自专栏Albert陈凯

    2018-11-23 数据引擎排名,2018年11数据库趋势图

    image.png 实时数据 https://db-engines.com/en/ranking_trend 包含范围与数据存储相关的 Complete ranking Relational DBMS

    1K30发布于 2018-12-17
领券