首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏人人都是数据分析师

    统计学(2)|AB测试—理论基础

    所以,为了实现吹过的牛逼,这篇”A/B测试—理论基础“应运而生。 现阶段,很多公司都在用A/B测试这一工具推进业务发展,特别是《增长黑客》系列图书的流行。 但是遗憾的是,真正将A/B测试用明白的公司寥寥无几,其中对A/B测试有扎实理论基础的人更是稀缺。不知所以然,何谈灵活运用? 2 A/B测试的本质 上一篇统计学必知必会中,ZZ详细的剖析了统计学中关于假设检验部分的发展历程,从计数到均值方差;从总体到样本;从频率到概率;从指标到分布;最后由于现实世界的限制,研究从样本推断总体, 当总体是正态分布的情况下,我们可以推导出关于样本方差 S^{2}的分布形式为(具体推导过程感兴趣的同学在评论区留言,我会把推导过程回复): 其中, 为自由度为 的卡方分布,需要注意的是,样本方差的此分布形式有前提

    1.4K20发布于 2021-05-13
  • 来自专栏Hsinyan写字的地方

    Word2vec理论基础——词向量

    按照这个语料库可以构建出一个词典 {"John": 1, "likes": 2, "to": 3, "watch": 4, "movies'": 5, "also":6, "football": 7, Mary likes too.可表示为 [1,2,1,1,1,0,0,0,1,1] 词权重 TF-IDF(Term Frequency - Inverse Document Frequency) 词t的 依旧以上面两句作为语料库,为了能够考虑到顺序的影响因素,为2-gram建立索引,得到词典如下 word index John likes 1 likes to 2 to watch 3 watch movies mathrm{P}(\text { too }) *\mathrm{P}(\text { likes })* \mathrm{P}(\text { Mary }) \end{aligned} Bigram/2- 400k,语料库大小为1~60Btoken 难以为词典中新加入的词分配词向量 与其他深度学习模型框架差异过大 NNLM(Neural Network Language model) NNLM是word2vec

    71920编辑于 2022-06-19
  • 来自专栏微信公众号【Java技术江湖】

    分布式系统理论基础2 :CAP

    /Java-Tutorial 喜欢的话麻烦点下Star哈 本文也将同步到我的个人博客: www.how2playlife.com 该系列博文会告诉你什么是分布式系统,这对后端工程师来说是很重要的一门学问 ,我们会逐步了解分布式理论中的基本概念,常见算法、以及一些较为复杂的分布式原理,同时也需要进一步了解zookeeper的实现,以及CAP、一致性原理等一些常见的分布式理论基础,以便让你更完整地了解分布式理论的基础 CAP在程序员中也有较广的普及,它不仅仅是“C、A、P不能同时满足,最多只能3选2”,以下尝试综合各方观点,从发展历史、工程实践等角度讲述CAP理论。希望大家透过本文对CAP理论有更多地了解和认识。 CAP理论看似给我们出了一道3选2的选择题,但在工程实践中存在很多现实限制条件,需要我们做更多地考量与权衡,避免进入CAP认识误区[7]。 CA非0/1的选择 P 是必选项,那3选2的选择题不就变成数据一致性(consistency)、服务可用性(availability) 2选1?

    61710发布于 2019-12-03
  • 来自专栏全栈程序员必看

    进程理论基础

    必备的理论基础: #一 操作系统的作用: 1:隐藏丑陋复杂的硬件接口,提供良好的抽象接口 2:管理、调度进程,并且将多个进程对硬件的竞争变得有序 #二 多道技术: 1.产生背景 (2)执行/运行(Running)状态当进程已获得处理机,其程序正在处理机上执行,此时的进程状态称为执行状态。    正常退出(自愿,如用户点击交互式页面的叉号,或程序执行完毕调用发起系统调用正常退出,在linux中用exit,在windows中用ExitProcess)   2. 2. 进程挂起是自身原因,遇到I/O阻塞,便要让出CPU让其他进程去执行,这样保证CPU一直在工作   2.

    55620编辑于 2022-07-21
  • 来自专栏hotarugaliの技术分享

    编码理论基础

    2. 码率的定义 定义五:一个 q 元 (n,M) 码的码率定义为 图片 ​ 图片 3. 一种是关于码字分量位置集合的置换,称为换位型置换,记为 σ1 图片 另一种是关于字母表 图片 的置换,称为换元型置换,记为 σ2​: 图片 定义二十:两个 q 元 (n,M) 码是等价的 附录 《编码理论基础》by 陈鲁生

    1.9K10编辑于 2022-08-30
  • 来自专栏Java成长之路

    Solr理论基础

    匹配2012年22日到2012年8月2日期间创建的文档,可以执行以下搜索: Query: created:[2012-02-01T00:00.0ZTO2012-08-02T00:00.0Z] 模糊/编辑距离搜索 Query: administrator~2 匹配两个以内的编辑距离. (这是默认值) Query:administrator~N 匹配N个以内的编辑距离 注意: 2个以上的编辑距离会使得搜索速度大幅下降。 q=*:*&shards=box1:8983/solr/core1,box2:8983/solr/core2,box2:8983/solr/core3 以上例子有4个特点: 该分片参数用于指定一个或多个 它们可以放在同一台机器上,例如:这里示例的内核core2和core3都放在box2机器上。 集群 vs.

    2.1K30发布于 2018-09-29
  • 来自专栏学海无涯

    Combine理论基础

    面向异步数据流的编程思想。业界比较知名的响应式框架是 ReactiveX 系列。Rx 也有 Swift 版本 — RxSwift。

    1.1K10发布于 2020-02-18
  • 来自专栏java编程那点事

    iOS理论基础(二)

    2. 2. 2. 如果方法返回值为结构体,发送给 nil 的消息将返回0。结构体中各个字段的值将都是0。 2. 如果方法的返回值不是上述提到的几种情况,那么发送给 nil 的消息的返回值将是未定义的。

    74110编辑于 2023-02-25
  • 来自专栏java编程那点事

    iOS理论基础(一)

    d.assign 可以用非 OC 对象,而 weak 必须用于 OC 对象 2.怎么用 copy 关键字?

    37120编辑于 2023-02-25
  • 来自专栏wym

    树状数组理论基础

    2)在进行连续求和操作a[1]+a[2]+....+a[n]时,只需要将树状数组中某几个元素进行求和。    3)在对某一个元素进行修改时,也只需要修改树状数组中某几个元素的和即可。 2)数组e表示树状数组。图中任意一个元素e[i]是由多个或一个a中的元素的和构成的。 例如,e[1]=a[1],e[4]=e[2]+a[3]+a[4]=e[1]+e[2]+e[3]+e[4]. 3)如果数字i的二进制表示中末尾有k个连续的0,则e[i]是a数组中连续2的k次方个元素的和, 即e[i]=a[i-2^k+1]+a[i-2^k+2]+.... 例如,34转化为二进制 为100010,最后一个1在第二位,所以lowbit返回值为2.     

    52620发布于 2018-08-30
  • 来自专栏wym

    线段树理论基础

    对于一个非叶子结点[L,R],它的左儿子所表示的区间为[L,(L+R)/2],右儿子表示的区间为[(L+R)/2+1,R].根据定义,线段树是一棵平衡二叉树,它的叶子结点的数目为N,即整个区间的长度。 2)查询一段区间的最大值。 这是经典的RMQ(range minimun/maximun query,区间最值查询)问题,用线段树该如何解决?题目既有更新,又有查询。 更新是点的更新,查询是区间查询。 lc=d*2,rc=d*2+1; build(lc,l,mid); build(rc,mid+1,r);//递归建立左右子树 tr[d].mx=max(tr[lc].mx,tr[rc].mx);   / lc=d*2,rc=d*2+1; if(r<=mid) return query(lc,l,mid); else if(l>mid) return query(rc,mid+1,r); else return lc=d*2,rc=d*2+1; if(pos<=mid)modify(lc,pos,v); else modify(rc,pos,v); tr[d].mx=max(tr[lc].mx,tr[rc].mx

    81330发布于 2018-08-30
  • 来自专栏小坤探游架构笔记

    分布式理论基础

    当发起一个事务请求操作通过服务A来调用服务B的时候,此时服务节点B需要同步数据到其他冗余服务节点B1以及B2,如果此时有读取请求的操作来访问服务节点A,为了保证看到的数据是最新的,这个时候由于B1或者B2 ,其中有一个参与者服务节点产生不可用的情况,这个时候参与者节点将无法接收到提交或者回滚信息,那么这个时候就会产生数据不一致. 2PC的整体流程总结 ? 3PC事务协议 在实际应用场景中,3PC的使用场景并不多,大部分是基于2pc的实现来完成分布式事务,甚至是为了保证数据的强一致性会采取TCC的事务协议来完成,对于3PC现简单阐述如下: ? 可以看到TCC是建立在业务基础上来保证分散的服务节点的事务一致性,实现相对比2PC更为复杂些. v1转变为v2的状态为过渡状态.

    2K52发布于 2020-06-16
  • 来自专栏存储内核技术交流

    ​纠删码理论基础

    编码过程是将文件分割为固定大小的文件块,针对这些被分割的文件块编码为k个块(k个块中包括了k1个数据块和k2个校验块)。 改进1,冗余矩阵采用柯西矩阵,解码过程中的求逆矩阵的计算复杂度有O(r三次方)降低到O(r的二次方);改进2,将有限域中的每个数表示成一个二维矩阵,使得有限域上的乘法运算转换为异或运算,提高运算效率的同事减低复杂度

    1.8K20编辑于 2022-08-17
  • 来自专栏Initial programming

    初识Linux · Socket理论基础

    网络理论基础 ip地址 · ip地址是用来标识网络中的主机的地址,一般分为IPv4和IPv6 · 对于IPv4来说,IP地址是一个4字节,32位的整数 · 常用“点分十进制”来表示一个IP地址,其中范围一般是 传输层协议 2.有连接 3.可靠传输 4.面向字节流 对于UDP来说,它的特征是: 1.传输层协议 2.无连接 3.不可靠传输 4.面向数据报 我们要注意到的一个点是,以上的描述是特征

    21310编辑于 2025-03-08
  • 来自专栏DotNet 致知

    面向对象编程理论基础

    这节来给大家讲一下面向对象编程的理论基础,在这之前我先来给大家讲个故事: 热爱探索的星际流浪者西夏普某天,开着他的小破宇宙飞船来到了一个无名星球,像往常登陆某个星球一样,他准备先围绕星球环行一周再着陆

    25710编辑于 2023-09-08
  • 来自专栏旧云博客

    浅析HTTPS原理及理论基础

    随着互联网高速发展,网络安全也越来越被人重视,而传统的HTTP协议是明文传输,若HTTP请求被骇客截取,就能轻松获取其中内容,存在极大安全隐患。为了解决这个问题,Netscape 公司制定了HTTPS协议,HTTPS可以将数据加密传输,也就是传输的是密文,即便黑客在传输过程中拦截到数据也无法破译,这就保证了网络通信的安全。 际上包含了两次HTTP传输,可以细分为8步:

    45110发布于 2021-08-09
  • 来自专栏决胜机器学习

    机器学习(十六) ——SVM理论基础

    机器学习(十六)——SVM理论基础 (原创内容,转载请注明来源,谢谢) 一、概述 支持向量机(supportvector machine,SVM),是一种分类算法,也是属于监督学习的一种。 2、性质 δ值会影响到高斯核函数的划分结果。下图是不同的δ值对应的三维图像,以及其等价线图。 五、高斯核函数实际判定过程 假设样本l(1),则其对应的x1和x2已经固定,则带入到原来拟合好的边界函数中,可以得到对应的点f的值。 2)字符串核函数(stringkernel) 当涉及到文本处理的时候,通常用到这个核函数。 2)特征少、样本正常 此时使用svm的高斯核函数非常合适。 3)特征少、样本非常多 此时也不适用高斯核函数,因为其计算量太大,速度太慢。

    1K70发布于 2018-03-07
  • 来自专栏贾维斯Echo的博客

    计算机理论基础

    计算机就是人类的奴隶,取代人去干活,提高效率 2、什么是编程语言?什么是程序?什么是编程?为何要编程?    1.操作系统:就是一个协调、管理、控制计算机硬件资源与应用软件资源的一个控制程序   2.应用软件:为了某种特定的用途而被开发的软件。 2.产品测试没有发现bug,即可上线。   3.上线失败解决方案:小bug找开发人员修改,重大bug问题需要回滚到上一个版本。    4.一到两周一个一个小版本,一个月一次大版本,期间不定个数bug修改版本 6运维的三大职责   1.优化网站,提升用户体验   2.做好数据备份,保证数据安全   3、保证服务器7X24小时不间断运行,    1个CPU   4个核心   16G DELL 2U R720 16核心32线程 主频2.0 E5-2650 *2个、 32G内存、 600GSAS硬盘*4块  DELL H710阵列卡 带512

    56530编辑于 2023-10-18
  • 分布式事务理论基础

    2理论基础 接下来我们就进入分布式事务理论基础的学习。 解决分布式事务问题,需要一些分布式系统的基础知识作为理论指导。 但是因为网络出现了故障,机器没有挂,然后node 3与node 1和node 2之间断开了连接。 node 1,node 2,正常访问啊,它们之间是能够感知到对方的,但node 3感知不到了。 那node1和node2它们俩是一个区,node3自己是一个分区。 这个时候如果有用户向node 02写入了一个新的数据。 那node 02是可以把数据同步给node 01的。 我让node 3它等待node 2这个网络的恢复和数据的同步。 在恢复之前。所有来访问我的请求,我都阻塞在这里,说你们等等我这数据还没好。 可不可以? 那如果这么做,我是不是就能够满足数据的一致性了?

    36110编辑于 2023-10-17
  • 来自专栏Java后端开发博客

    NoSQL数据库理论基础

    # NoSQL数据库理论基础 分布式数据库的数据管理 CAP理论 为什么不能同时选择C、A、P?

    1K20编辑于 2022-12-25
领券