首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏mysql

    hhdb数据库介绍(9-6)

    数据强一致 主从数据一致性检查 计算节点提供数据节点中的主从存储节点一致性校验的功能。需要校验的主备存储节点属于同一个数据节点。 主从数据一致性检查,可校验主库与从库各个表的表结构是否相同,表数据是否一致,主从是否延迟。当表数据在主库与从库间仅有少量的数据不一致时,主从数据一致性检查可定位到不一致的数据行主键值。 数据强一致性(XA事务) 在关系集群数据库系统中,数据被拆分后,同一个事务可能会操作多个数据节点,产生跨库事务。 在跨库事务中,事务被提交后,若事务在其中一个数据节点COMMIT成功,而另一个数据节点COMMIT失败;已经完成COMMIT操作的数据节点,数据已被持久化,无法再修改;而COMMIT操作失败的数据节点, 数据已丢失,这种情况会导致数据节点间的数据不一致。

    68510编辑于 2025-03-18
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 9-6 在逻辑回归中使用多项式特征

    本小节主要介绍在逻辑回归算法中使用多项式特征以解决非线性数据的分类问题,并通过具体的编程实现。 接下来就来使用添加多项式项的逻辑回归算法对上面非线性的数据进行编程实验。 这里使用我们自己封装的LogisticRegression类,为了简单没有将样本划分成训练集和测试集,直接将整个数据集进行训练,在整个数据集上的分类准确度为60.5%,显然这个准确率比较低。 没有添加多项式的逻辑回归算法处理非线性数据的决策边界如上图所示。 此时的决策边界是一个圆形,它能够更好的对这样的非线性数据进行划分。

    1.8K30发布于 2020-03-02
  • 水滴科技基于大模型重构保险服务:从降本增效到全场景智能落地

    9-6点,无法覆盖节假日。 服务效能对比 以下为AI坐席与人工平均水平的关键指标对比(数据来源:水滴科技内部评估): 维度 人工平均水平 AI坐席表现 服务能力 100% 达到的平均水平(医疗场景) 保险知识 5-10款 千款保险产品库支持 服务时间 周一到周五 9-6点 全时段覆盖(含节假日) 服务态度 情绪波动 恒定标准 成本结构 边际成本高 20%人工坐席 + 80%AI坐席 2. 运营数据趋势 根据水滴科技提供的月度数据(2月-12月),AI介入后的业务数值表现如下(注:原文数据表头为“月份”与“数值”,具体指标名称原文未明确): 日期 数值 百分比 2月17日 38 40% 3 —— 黄明星,水滴科技(主讲数据来源:2024腾讯全球数字生态大会 - 《大模型在水滴的应用实践》

    19810编辑于 2026-05-30
  • 来自专栏博文视点Broadview

    运营看哪些数据

    ---- --正文-- 运营看哪些数据? 第一大类是原始数据,包括如下几类。 (1)市场属性数据:行业数据、竞品数据,以及获得用户流量的渠道属性数据,包括渠道分类、曝光、点击、播放、流量、成本等数据。 (4)商品或内容方向的属性数据:如电商中商品的信息数据,包括分类、属性、详情页面、视频、图片等数据,或资讯内容文章的分类、作者、时效、标签等数据。 (6)运营策略干预产生的数据:本质上还是上述几类数据,只是与活动或实验等项目相关的数据会被打上某次活动或实验的标签,可以单独拿出来统计和分析。 第二大类是对原始数据的统计数据,包括如下几类。 ▊《运营之上:互联网业务的全局运营方法论与实践》 徐全安 著 10年+跨越不同行业、多次从0到1经验总结 通用运营框架、抓手方法论总结 让运营“做且只做”有价值的工作 本书是在运营的基础职能之上对“

    73310编辑于 2023-05-19
  • 来自专栏华章科技

    数据解读城市:北京 本地VS外地

    今天小编找来一篇运用大数据解读城市人口分布的文章,供大家阅读!

    42410发布于 2018-08-13
  • 来自专栏落雨的专栏

    【Python】学习笔记week10-0 循环

    sum=sum+eval(s) s=input() print("该歌手最终成绩为{:.1f}".format(sum/count)) 【PYTHON】1-2/3+3/5-4/7+5/9- #循环 题目描述 求和 1-2/3+3/5-4/7+5/9-6/11+...

    29.2K87编辑于 2021-12-11
  • 来自专栏数据森麟

    数据团队思考:数据的通用技能要求

    作者:木东居士 来源:木东居士 0x00 前言 最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据该具备哪些通用的技能。 “数据开发到底用不用学算法?” 0x01 Excel 掌握指数:5颗星 掌握人群:所有数据 Excel 是每个数据都应该掌握的一项技能,不管是研发还是产品,Excel 应该是必备的一项基本技能。 0x02 Sql 掌握指数:4.5颗星 掌握人群:所有数据 从研发岗来讲,数据开发、数据仓库、数据分析都应该具备 Sql 能力,这点不用多做解释。那么数据产品和数据运营是否应该掌握 Sql 呢? 至于说数据产品和运营是否需要,居士认为,简单了解就行,不是核心技能要求。 0x04 大数据 掌握指数:4.5颗星 掌握人群:所有数据数据时代,所有数据都应该具备一定的大数据知识! 0x05 统计学 掌握指数:4颗星掌握人群:所有数据 统计学,玩数据的同学都应该了解一定的统计学知识!一般来讲,大部分数据分析都应该具备统计学的知识。那么问题来了?数据仓库是否也需要了解统计学?

    49730发布于 2019-09-27
  • 来自专栏木东居士的专栏

    数据团队思考:数据的通用技能要求

    0x00 前言 最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据该具备哪些通用的技能。 “数据开发到底用不用学算法?” “Excel 有必要学吗?” 0x01 Excel 掌握指数:5颗星 掌握人群:所有数据 Excel 是每个数据都应该掌握的一项技能,不管是研发还是产品,Excel 应该是必备的一项基本技能。 0x02 Sql 掌握指数:4.5颗星 掌握人群:所有数据 从研发岗来讲,数据开发、数据仓库、数据分析都应该具备 Sql 能力,这点不用多做解释。那么数据产品和数据运营是否应该掌握 Sql 呢? 至于说数据产品和运营是否需要,居士认为,简单了解就行,不是核心技能要求。 0x04 大数据 掌握指数:4.5颗星 掌握人群:所有数据数据时代,所有数据都应该具备一定的大数据知识! 0x05 统计学 掌握指数:4颗星掌握人群:所有数据 统计学,玩数据的同学都应该了解一定的统计学知识!一般来讲,大部分数据分析都应该具备统计学的知识。那么问题来了?数据仓库是否也需要了解统计学?

    92030发布于 2019-07-15
  • 来自专栏小小挖掘机

    数据团队思考:数据的通用技能要求

    0x00 前言 最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据该具备哪些通用的技能。 “数据开发到底用不用学算法?” “Excel 有必要学吗?” 0x01 Excel 掌握指数:5颗星 掌握人群:所有数据 Excel 是每个数据都应该掌握的一项技能,不管是研发还是产品,Excel 应该是必备的一项基本技能。 0x02 Sql 掌握指数:4.5颗星 掌握人群:所有数据 从研发岗来讲,数据开发、数据仓库、数据分析都应该具备 Sql 能力,这点不用多做解释。那么数据产品和数据运营是否应该掌握 Sql 呢? 至于说数据产品和运营是否需要,居士认为,简单了解就行,不是核心技能要求。 0x04 大数据 掌握指数:4.5颗星 掌握人群:所有数据数据时代,所有数据都应该具备一定的大数据知识! 0x05 统计学 掌握指数:4颗星掌握人群:所有数据 统计学,玩数据的同学都应该了解一定的统计学知识!一般来讲,大部分数据分析都应该具备统计学的知识。那么问题来了?数据仓库是否也需要了解统计学?

    62320发布于 2019-11-21
  • 来自专栏华章科技

    写给准数据数据世界入门指南

    接下来,再来看一句话: 成交10亿民币! 有些可能已经猜到了,我要分享的这两个词就是:维度+度量。 下图中,我将重点放到大道至简几个字,以及维度+度量上,而维度和度量下面分别放了所在家族的一些其他常用词汇,我稍后会解释。 ? (能有这个问题的妹子,你真想多了……),其实这里仔细分析,无非也是涉及到维度和度量两词: 维度:啊。 当然,则个领域,水很深,我只能简单描述一下,再深的也担心大家晕菜了——毕竟本文是写给非数据的。(其实作者本人也讲不粗来了……哈哈) ▍ 应用 ? 我说了,我无法教你具体复杂的数据分析案例。 过去放凤姐一晚,100个里只有5个点,现在放了林志玲一晚,100个人居然有99个点击。老板很高兴,而且确实成交额似乎是比过去略微高那么一点点了。

    59560发布于 2018-08-15
  • 来自专栏PPV课数据科学社区

    假如把地球的70亿浓缩为100,这组数据感到震撼

    因为有人制作了这组有趣的统计报告,把世界上的70亿想象成100,然后各种百分比的统计数据看起来就有点意思了. ? 统计数据看起来会是这样的: 11在欧洲、5在北美洲、9在南美洲、15在非洲、60在亚洲 ? 49生活在乡下、51生活在城市 ? 12讲中文、5讲西班牙语、5讲英语、3讲阿拉伯语、3讲印度语、3讲孟加拉语、3讲葡萄牙语、2讲俄罗斯语、2讲日语、还有62各讲一种语言 ? 83个能识字、17是文盲 ? 33是基督徒、22是穆斯林、14是印度教徒、7是佛教徒、12信仰其他宗教、还有12没有宗教信仰 ? 26不到14岁、66在15-64岁之间、8超过65岁 ? 男人有50个,女人有50个 ? 看完这组数据,假如你能上网,有手机,上过大学,还有什么理由抱怨?

    1.5K40发布于 2018-04-19
  • 来自专栏IT技术圈

    PTA | 习题2-4 求交错序列前N项和 (15分)

    一、题目描述 本题要求编写程序,计算交错序列 1-2/3+3/5-4/7+5/9-6/11+... 的前N项之和。 输入格式: 输入在一行中给出一个正整数N。 输入样例: 5 输出样例: 0.917 二、思路分析 观察交错序列 1-2/3+3/5-4/7+5/9-6/11+...发现, 分子:1,2,3,4,5,6...

    3.1K30发布于 2021-07-14
  • 来自专栏机器学习与自然语言处理

    Stanford机器学习笔记-9. 聚类(Clustering)

    显然,现实生活中不是所有数据都带有标记(或者说标记是未知的)。所以我们需要对无标记的训练样本进行学习,来揭示数据的内在性质及规律。 一个非聚类的例子是鸡尾酒会算法,即从带有噪音的数据中找到有效数据(信息),例如在嘈杂的鸡尾酒会你仍然可以注意到有人叫你。所以鸡尾酒会算法可以用于语音识别(详见wikipedia)。 例如根据的身高和体重划分T恤的大小码,如图9-4所示。 ? 还是以根据的身高和体重划分T恤的大小码为例,若我们想将T恤大小划分为S/M/L这3种类型,那么K的取值应为3;若想要划分为XS/S/M/L/XL这5种类型,那么K的取值应为5。如图9-6所示。 图9-6 划分T恤size的两种不同情况 【推荐阅读】讨论K均值算法的缺点

    1.6K110发布于 2018-03-13
  • 来自专栏PPV课数据科学社区

    一个资深数据数据挖掘解读

    (一)纯粹的数据加工 侧重于变量加工和预处理,从源系统或数据仓库,对相关数据进行提取、加工、衍生处理,生成各种业务表。 文本和湿。关于文本分析,最近朋友圈有篇分享,很有意思,号称可以让你瞬间变成湿。原理很简单,就是先把《全宋词》分词,然后统计频数前100的词语。 数据基本上来源于仓库系统,然后运用SQL、SAS、R,提取、加工、建模和分析。 (二)数据类型 数据类型,主要包括“结构化”和“非结构化”两类数据。前者就是传统的二维表结构。 银行里面的数据,更多的是结构化数据,也有少量的非结构化数据(投诉文本、贷款审批文本等)。业务部门对非结构化数据的分析需求比较少。因此,在非结构化数据的分析建模方面,稍显不足。 互联网,更多的是网络日志数据,以文本等非结构化数据为主,然后通过一定的工具将非结构化数据转变为结构化数据,进一步加工和分析。

    71250发布于 2018-04-25
  • 来自专栏PPV课数据科学社区

    【推荐】从设计到数据——写给非数据数据入门

    原因很正常:大部分都投入到了业务系统建设中(彼时,供应链管理系统、物流管理系统、认证系统、以及前台都处于开荒建设阶段)。 接下来,再来看一句话:成交10亿民币! (能有这个问题的妹子,你真想多了……),其实这里仔细分析,无非也是涉及到维度和度量两词: 维度:啊。 当然,则个领域,水很深,我只能简单描述一下,再深的也担心大家晕菜了——毕竟本文是写给非数据的。(其实作者本人也讲不粗来了……哈哈) 四. 应用 我说了,我无法教你具体复杂的数据分析案例。 过去放凤姐一晚,100个里只有5个点,现在放了林志玲一晚,100个人居然有99个点击。老板很高兴,而且确实成交额似乎是比过去略微高那么一点点了。

    1.2K70发布于 2018-04-23
  • 来自专栏数据科学与人工智能

    数据】关于数据质量,营销必知六问

    小编邀请您,先思考: 1 如何让数据优质? 数据驱动的广告需要优质数据。但大量的不良数据和经不起推敲的数据使用方式可能会给营销活动造成不良影响。 营销人员需要知道何时使用自己的数据,何时依赖合作伙伴。 如果你定义了一个非常精准的人群: 30-40岁,女性,在过去14天,在指定的四个区域,买了特定的某一本杂志,最后找到30。这是一个很有价值的目标人群,但数量太少了。 例如,将Cookie数据或设备ID相匹配可能会降低数据质量。你可能会合并一堆数据,但是匹配率太低,所以最终得到的数据集没什么价值。 相反,与其他数据集合匹配良好的数据集可以提高数据质量。 当说到一个数据集与其他数据集的集成,那一般必须合并三到四个数据集,才可以清晰整理出阅读数据可见率或广告欺诈行为,但与此同时这些数据集的集成将面临相当大的复杂性。 每个营销人员都应该询问在引入新数据或分析现有数据时如何合并数据。如果你不明白数据是如何构建的,它可能导致非常错误的结论。

    1.1K70发布于 2018-03-27
  • 来自专栏全栈程序员必看

    体验vSphere 6之7-为虚拟机启用容错

    图9-2 故障详细信息 (3)在”选择数据存储”对话框,为辅助虚拟机选择数据存储。在新版本的FT中,主虚拟机与辅助虚拟机可以放置在不同的数据存储中,这进一步提高了”容错”的安全性,如图9-3所示。 图9-3 为辅助虚拟机选择数据存储 (4)在”选择主机”对话框,为辅助虚拟机选择主机,如图9-4所示。辅助虚拟机、主机要运行在不同的主机上。 图9-5 完成 (6)返回到vSphere Web Client管理控制台,在”近期任务”中会显示为虚拟机打开容错的配置信息,如图9-6所示。 图9-6 为虚拟机打开容错 (7)为虚拟机打开容错之后,右击虚拟机名称,在FT中可以看到,关闭FT、迁移辅助虚拟机等选项,如图9-7所示。

    1.5K40编辑于 2021-12-23
  • 来自专栏速入大数据

    数据无罪,使用有度:从技术角度谈数据伦理

    数据无罪,使用有度:从技术角度谈数据伦理在大数据时代,数据几乎无处不在,它记录我们的行为、偏好,甚至影响我们的生活决策。 然而,随着数据利用的价值被不断挖掘,数据伦理的问题也愈加突出:我们是否能够确保在采集、存储和使用数据时不侵害他人的权益?本文从技术的视角,聊聊如何负责任地使用数据,践行数据伦理。 一、数据不是“万能钥匙”数据有它的价值,但也不能成为“为所欲为”的借口。在很多情况下,数据的滥用并不是技术问题,而是道德问题。 二、数据分析:不偏不倚数据分析是技术的核心任务,但如果不注意,就容易陷入伦理风险。例如,一些模型训练过程中可能会因数据本身存在偏见,导致结果不公平。 四、总结数据伦理从来不是“后置选项”,而是贯穿技术开发全流程的责任。从数据收集到分析、再到应用,技术需要始终保持对法律、道德和社会责任的敏感性。

    54510编辑于 2025-03-27
  • 来自专栏A周立SpringCloud

    跟我学Spring Cloud(Finchley版)-23-Spring Cloud Config高可用

    Config Server未注册到Eureka Server上 对于这种情况,Config Server的高可用可借助一个负载均衡器来实现,如图9-6所示。 ? 如图9-6,各个微服务将请求发送到负载均衡器,负载均衡器将请求转发到其代理的其中一个Config Server节点。这样,就可以实现Config Server的高可用。

    40920发布于 2019-03-14
  • 来自专栏机器学习AI算法工程

    一个资深数据数据挖掘 的解读

    (一)纯粹的数据加工 侧重于变量加工和预处理,从源系统或数据仓库,对相关数据进行提取、加工、衍生处理,生成各种业务表。 文本和湿。关于文本分析,最近朋友圈有篇分享,很有意思,号称可以让你瞬间变成湿。原理很简单,就是先把《全宋词》分词,然后统计频数前100的词语。 数据基本上来源于仓库系统,然后运用SQL、SAS、R,提取、加工、建模和分析。 (二)数据类型 数据类型,主要包括“结构化”和“非结构化”两类数据。前者就是传统的二维表结构。 银行里面的数据,更多的是结构化数据,也有少量的非结构化数据(投诉文本、贷款审批文本等)。业务部门对非结构化数据的分析需求比较少。因此,在非结构化数据的分析建模方面,稍显不足。 互联网,更多的是网络日志数据,以文本等非结构化数据为主,然后通过一定的工具将非结构化数据转变为结构化数据,进一步加工和分析。

    93390发布于 2018-03-13
领券