首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏算法channel

    11概率分布,你了解几个?

    了解常见的概率分布十分必要,它是概率统计的基石。这是昨天推送的 从概率统计到深度学习,四大技术路线图谱,都在这里!文章中的第一大技术路线图谱如下所示,图中左侧正是本文要总结的所有常见概率分布。 ? 3 二项分布 假设试验只有两种结果:成功的概率为 θ,失败的概率为 1-θ. 则二项分布描述了:独立重复地进行 n 次试验中,成功 x 次的概率概率密度函数: ? 期望: ? 方差: ? 典型的一维正态分布概率密度函数为 : ? ? 5 拉普拉斯分布 概率密度函数: ? 期望: ? 方差: ? ? 11 多项式分布与狄里克雷分布 多项式分布的质量密度函数: ? 狄利克雷分布概率密度函数: ? 可以看到,多项式分布与狄里克雷分布概率密度函数非常相似,区别仅仅在于前面的归一化项: 多项式分布是针对离散型随机变量,通过求和获取概率。 狄里克雷分布时针对连续型随机变量,通过求积分来获取概率

    22.7K31发布于 2019-10-08
  • 来自专栏小小挖掘机

    11概率分布,你了解几个?

    3 二项分布 假设试验只有两种结果:成功的概率为 θ,失败的概率为 1-θ. 则二项分布描述了:独立重复地进行 n 次试验中,成功 x 次的概率概率密度函数: ? 期望: ? 方差: ? 典型的一维正态分布概率密度函数为 : ? ? 5 拉普拉斯分布 概率密度函数: ? 期望: ? 方差: ? ? 9 贝塔分布 贝塔分布是定义在 (0,1) 之间的连续概率分布。 如果随机变量 X 服从贝塔分布,则其概率密度函数为: ? 记做 ? 期望为: ? 方差为: ? ? 11 多项式分布与狄里克雷分布 多项式分布的质量密度函数: ? 狄利克雷分布概率密度函数: ? 可以看到,多项式分布与狄里克雷分布概率密度函数非常相似,区别仅仅在于前面的归一化项: 多项式分布是针对离散型随机变量,通过求和获取概率。 狄里克雷分布时针对连续型随机变量,通过求积分来获取概率

    6.4K00发布于 2019-10-10
  • 来自专栏又见苍岚

    概率论基础 - 11 - 高斯分布 正态分布

    本文记录高斯分布。 高斯分布 / 正态分布 正态分布是很多应用中的合理选择。如果某个随机变量取值范围是实数,且对它的概率分布一无所知,通常会假设它服从正态分布。 在具有相同方差的所有可能的概率分布中,正态分布的熵最大(即不确定性最大)。 一维正态分布 正态分布概率密度函数为: p(x)=\frac{1}{\sqrt{2 \pi} \sigma} e{-(x-\mu){2} /\left(2 \sigma^{2}\right)},-\infty <x<\infty 其中 \mu, \sigma(\sigma>0) X 的概率密度函数如上所述, 则称 X 服从参数为 \mu, \sigma 的正态分布或者高斯分布,记作 X \sim N\left(\mu, \sigma^{2}\right) 特别的, 当 \mu=0, \sigma=1 时,称为标准正态分布,其概率密度函数记作 \varphi(x) , 分布函数记作 \

    2.2K30编辑于 2022-08-05
  • 来自专栏生物信息学、python、R、linux

    概率概率分布 Beta-分布(1)

    Beta分布在统计学中是定义在[0,1]区间内的一种连续概率分布,有α和β两个参数。 其概率密度函数为: ? ? wiki_PDF 累计密度函数为: ? ? wiki_CDF 就PDF的公式而言,Beta分布于二项分布还是比较相似的: ? ,概率是个确定的参数,比如抛一枚质地均匀的硬币,成功概率是0.5;而对于Beta分布而言,概率是个变量。 如果我们每次都随机投一定数量的硬币,最后看这些概率分布情况,判断这个硬币是否质地不均。不过Beta分布的主要用途在于,当我们有先验信息时,再考虑实际情况,可能会对之后成功概率的预测更加准确。 之后将会更详细的讲一下共轭先验和Beta分布的例子。

    1.4K30发布于 2020-04-24
  • 来自专栏生物信息学、python、R、linux

    概率概率分布 Beta-分布(2)

    共轭先验 2.1定义 共轭先验是指的在贝叶斯学派中,如果先验分布和后验分布属于同类,则先验分布与后验分布被称为共轭分布,而先验分布被称为似然函数的共轭先验(Conjugate prior)。 后验分布 根据样本的先验分布,再加上实际数据的分布,利用条件概率公式等得到的结果。 似然函数 似然有的时候可能与概率差不多,但是两者的关注点不同。 比如我们投硬币,假设这个硬币是质地均匀的公平硬币,连续投两次,都出现正面的概率是0.25;而似然主要关注,都出现了正面的情况下,这枚硬币是否是个公平硬币。 棒球中的平均击球率是用一个运动员击中棒球的次数除以他总的击球数量,棒球运动员的击球概率一般在0.266左右。假设我们要预测一个运动员在某个赛季的击球率,我们可以计算他以往的击球数据计算平均击球率。 因此,假如我们知道在这个赛季,该运动员打了300次球,击中了100次,那么最终的后验概率为Beta(181, 419)。

    2K20发布于 2020-04-24
  • 来自专栏数据科学CLUB

    常见概率分布

    伯努利分布 在一次实验中,事件A出现的概率为 ,不出现的概率为 ,若用 记事件A出现的次数,则 仅取值0或1,相应的概率分布为 这个分布称为伯努利分布,也叫两点分布。 超几何分布 对某批N 件产品进行不放回抽样检查,若这 批产品中有M件次品,现从整批产品中随机抽出 n件产品,则在 这n件产品中出现的次品数x是随机变量,它取值0,1, 2,.. n,其概率分布为超几何分布 普通性:如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计. λ为任意正数,被称为Poisson分布的强度。λ越大,得到大值的概率越大;λ越小,得到小值的概率越大。 几何分布 在事件A发生的概率为p的伯努利试验中,若 以η记A首次出现时的试验次数,则η为随机变量,它可能取的 值为1,2,3,…其概率分布为几何分布: η k = 5 p = 0.6 X = 帕斯卡分布 在伯努利试验中,若以ζ记第r次成 功出现时的试验次数,则ζ是随机变量,取值r,r+l, .其概率 分布为帕斯卡分布: ζ 负二项分布 对巴斯卡分布,可以略加推广,即去掉r是正整数的限制

    1.1K20发布于 2020-06-10
  • 来自专栏计算机基础

    概率分布

    概率空间:sample space,events space和probability function 概率函数是将事件映射到区间 0,1 的实值函数,概率函数遵循概率公理(Kolmogorov Axioms Factoring joint probabilities P(A,B)=P(A|B) \ast P(B) P(A,B,C)=P(A|B,C)∗P(B,C)=P(A|B,C)∗P(B|C)∗P(C) 概率分布 Probability Mass Function (PMF) \sum_{x \in X} f_x(x) = 1 离散变量的概率和为1 累积分布函数 cdf cumulative distribution ) #bounds and granularity plt.plot(x, stats.norm.pdf(x, mu, sigma)) plt.show() 函数的期望 Expectation:函数在概率分布下的平均值 ,离散分布计算加权平均值,权重由 x 值处的概率决定 离散分布 E[f] = \sum_x f(x)^r p(x) 连续分布 E[f] = \int f(x)^r p(x) dx Bernoulli

    43710编辑于 2024-08-07
  • 来自专栏流川疯编写程序的艺术

    概率分布的转换

    当然有了这个抽象之后,答案很容易上网就能够查到,具体如下[^tjjs]: 用大白话说: 变量x服从概率密度是f(x)的分布概率分布函数是F(x)[^gainian], ? 我们都有一个共识,生活处处存在着概率分布,尤其以钟形曲线的分布为要,其他的分布当然也很多。要想把握事物的内在规律,必须掌握事物的概率分布,之后根据需要对分布进行转化。 提到通过截获大量的密文,统计其中字符出现的概率分布,然后对照现实中各个字符出现的概率就能够找到加密字符和真实字符的对应关系。 大家肯定知道经济学同学考研也是要考《概率论》地,所以我们今天所说概率分布的转化不仅仅局限于工程领域。 所有的概率分布都可以转化成正态分布吗? 3. zhihu:在连续随机变量中,概率密度函数(PDF)、概率分布函数、累积分布函数(CDF)之间的关系是什么?

    2K30发布于 2019-01-18
  • 来自专栏又见苍岚

    概率论基础 - 10 - 常见概率分布

    本文记录常见的概率分布。 ) 积分为1 常见分布 均匀分布 离散随机变量的均匀分布 假设 X 有 k 个取值: x_{1}, x_{2}, \cdots, x_{k} , 则均匀分布概率密度函数( probability 概率分布函数: p(X=x)=\phi{x}(1-\phi){1-x}, x \in{0,1} 期望: \mathbb{E}[X]=\phi 方差: \operatorname{Var}[X] 假设随机变量 X \in{1,2, \cdots, K} , 其概率分布函数为: image.png ​ 其中 \theta_{i} 为参数, 它满足 \theta_{i} \in[0,1 二项分布 假设试验只有两种结果:成功的概率为 \phi , 失败的概率为 1-\phi_{\circ} 则二项分布描述了:独立重复地进行 n 次 试验中,成功 x 次的概率

    1.8K30编辑于 2022-08-05
  • 来自专栏算法channel

    通俗理解:概率分布函数、概率密度函数

    2 离散型随机变量的概率函数,概率分布分布函数 概率分布函数和概率密度函数之前,我们先来看看概率函数和概率分布是咋回事。 为什么我们花这么大的力气去研究这个概念。因为它实在太重要了,为什么呢? 2.1.1 概率分布 接下来讲概率分布,顾名思义就是概率分布,这个概率分布还是讲概率的。我认为在理解这个概念时,关键不在于“概率”两个字,而在于“分布”这两个字。 其实严格来说,它应该叫“离散型随机变量的值分布和值的概率分布列表”,这个名字虽然比“概率分布”长了点,但是肯定好理解了很多。 2.2 分布函数 说完概率分布,就该说说分布函数了。这个分布函数是个简化版的东西!全名应该叫概率分布函数。 看看下图中的分布律,这里的分布律明明就是我们刚刚讲的“概率函数”,完全就是一个东西。 但是我知道很多教材就是叫分布律的。 ? 概率分布函数就是把概率函数累加 我们来看看图上的公式,其中的F(x)就代表概率分布函数啦。

    11.7K11发布于 2019-09-27
  • 来自专栏机器学习与统计学

    【温故知新】概率笔记5——概率分布

    分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。 分布函数   有了函数X,就可以进而将事件的概率转换为普通的函数,于是有了分布函数的定义: ?   F(x)就是分布函数,它表示X ≤ x的概率。 同样,对于概率分布函数F(x)来说,我们也希望对任意的x都能找到对应的y,也就是P(X≤x)。别忘了,我们的目的是将事件转换为数,从而将概率转换为函数。 分布函数   离散事件的每个取值都对应一个概率,它的分布率大概长成这个样子: ?   它的分布函数: ?   在所有的分布函数中,x的取值范围都是关键,它强调了“事件”到“函数”的转换。    现在概率终于和积分联系在一起了,前方的视野也更加广阔起来。 分布函数   以正态分布为例: ?   f(t)被称为概率密度,或概率密度函数;F(x)表示f(t)与x轴围成的面积: ?   

    88420发布于 2019-04-10
  • 来自专栏个人分享

    机会的度量:概率分布

    变量的分布   随机变量取一切可能值或范围的概率概率的规律成为概率分布(probability distribution,简称分布).一个概率分布是和某总体(population)也称为样本空间(sampling 根据这种简单试验的分布,可以得到基于这个试验的更加复杂事件的概率。 ? 这里 ? 为二项式系数。 这里P(x)为n次试验中成功k次的概率,p为每次试验成功的概率。 不过现在很多统计学工具要统计二项分布的都已经直接实现了~ 多项分布为二项分布的推广,就好比调查顾客对5个品牌的饮料的选择中,每种品牌都会以一定的概率中选,假定这些概率为p1,p2,p3,p4,p5。 那么该批产品退回的概率是多少呢? 这里就满足了超几何分布。 这是一种不放回的抽样,如果放回的话那么这个物品还可能会被抽上,那么每次抽样时得到次品的概率是一样的,等于次品的比例,这就不是超几何分布而是二项分布了。

    94040发布于 2018-09-06
  • 来自专栏Vamei实验室

    概率论05 离散分布

    每个值对应有发生的概率,构成该离散随机变量的概率分布。 离散随机变量有很多种,但有一些经典的分布经常重复出现。对这些经典分布的研究,也占据了概率论相当的一部分篇幅。 在伯努利分布下,随机变量只有两个可能的取值: 1和0。随机变量取值1的概率为p。相应的,随机变量取值0的概率为1-p。 二项分布 为了理解二项分布是如何出现的,我们假设下面情况:进行n次独立测试,每次测试成功的概率为p(相应的,失败的概率为1-p)。这n次测试中的“成功次数”是一个随机变量。 绘制随机变量k的概率分布。 练习: 推导超几何分布概率质量函数,并绘制其概率分布。 总结 离散随机变量比较直观,容易理解。我们在这里介绍了一些经典分布,即随机变量取值的概率

    94830发布于 2018-09-25
  • 来自专栏Vamei实验室

    概率论06 连续分布

    密度函数是对累积分布函数的微分。连续随机变量在某个区间内的概率可以使用累积分布函数相减获得,即密度函数在相应区间的积分。 已经发生的衰变对后面原子衰变的概率分布无影响。用数学的语言来说,就是 image.png 等式的左边是原子存活了s的概率。而等式的右边是某一时刻t之后,原子再存活s时间的概率。 一个人活10年的概率和一个人到50岁后,再活10年的概率相等。这样的假设有可能与现实情况有所出入,需要注意。 正态分布 正态分布(normal distribution)是最常用到的概率分布。 Gauss 正态分布的发现来自于对误差的估计。早期的物理学家发现,在测量中,测量值的分布很有特点:靠近平均值时,概率大;远离平均值时,概率小。比如我们使用尺子去测量同一个物体的长度,重复许多次。 image.png 代表了概率分布的离散程度。 image.png 越小,概率越趋近对称中心 image.png 。

    1.5K80发布于 2018-01-18
  • 来自专栏Vamei实验室

    概率论05 离散分布

    每个值对应有发生的概率,构成该离散随机变量的概率分布。 离散随机变量有很多种,但有一些经典的分布经常重复出现。对这些经典分布的研究,也占据了概率论相当的一部分篇幅。 在伯努利分布下,随机变量只有两个可能的取值: 1和0。随机变量取值1的概率为p。相应的,随机变量取值0的概率为1-p。 这意味着我们进行无限多次测试,每次成功概率无穷小,但n和p的乘积是一个有限的数值。 泊松分布用于模拟低概率事件,比如地震。 绘制随机变量k的概率分布。 练习: 推导超几何分布概率质量函数,并绘制其概率分布。 总结 离散随机变量比较直观,容易理解。我们在这里介绍了一些经典分布,即随机变量取值的概率

    1.5K100发布于 2018-01-18
  • 来自专栏深度学习之tensorflow实战篇

    在统计学中概率分布中的概率密度函数PDF,概率质量PMF,累积分布CDF

    CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。 二. 对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为 FX(x)=Pr(X≤x)=⎧⎩⎨⎪⎪0 if x<012 if 0≤x<11 if x≥1FX(x)=Pr(X≤ x)={0 if x<012 if 0≤x<11 if x≥1F_X\left( x \right) =\Pr\left ( X\leq x \right )=\begin{cases}& 0\text 对于离散型随机变量,可以直接用分布律来描述其统计规律性,而对于非离散型的随机变量,如连续型随机变量,因为我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像随机变量那样进行描述,于是引入PDF 分布函数的意义   分布函数F(x)F(x)在点xx处的函数值表示XX落在区间(−∞,x](−∞,x]内的概率,所以分布函数就是定义域为RR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题

    2.2K30发布于 2019-01-25
  • 来自专栏DeepHub IMBA

    ​常用的连续概率分布汇总

    而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。 均匀分布概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 CDF曲线是 累积分布函数(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。 如果log(x)是正态分布,x是对数正态分布 指数分布概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。 伽玛分布 伽玛分布(Gamma Distribution)是统计学的一种连续概率函数,是概率统计中一种非常重要的分布。“指数分布”和“χ2分布”都是伽马分布的特例。 在概率论中,贝塔分布,也称Β分布,是指一组定义在(0,1) 区间的连续概率分布。 贝塔分布最适合表示概率概率分布 - 也就是说,当我们不知道概率是什么时,它表示概率的所有可能值。

    2.4K30发布于 2021-11-08
  • 来自专栏Vamei实验室

    概率论06 连续分布

    密度函数是对累积分布函数的微分。连续随机变量在某个区间内的概率可以使用累积分布函数相减获得,即密度函数在相应区间的积分。 已经发生的衰变对后面原子衰变的概率分布无影响。 一个人活10年的概率和一个人到50岁后,再活10年的概率相等。这样的假设有可能与现实情况有所出入,需要注意。 正态分布 正态分布(normal distribution)是最常用到的概率分布。 Gauss 正态分布的发现来自于对误差的估计。早期的物理学家发现,在测量中,测量值的分布很有特点:靠近平均值时,概率大;远离平均值时,概率小。比如我们使用尺子去测量同一个物体的长度,重复许多次。 [$\sigma$]代表了概率分布的离散程度。[$\sigma$]越小,概率越趋近对称中心[$x = \mu$]。

    1.1K10发布于 2018-09-25
  • 来自专栏Vamei实验室

    概率论07 联合分布

    我之前一直专注于单一的随机变量及其概率分布。我们自然的会想将以前的结论推广到多个随机变量。联合分布(joint distribution)描述了多个随机变量的概率分布,是对单一随机变量的自然拓展。 联合分布的多个随机变量都定义在同一个样本空间中。 对于联合分布来说,最核心的依然是概率测度这一概念。  离散随机变量的联合分布 我们先从离散的情况出发,了解多个随机变量并存的含义。 p(x, y)$$ 在求X的单一边缘分布时, 我们累加了相同x值、不同y值时的多个联合概率,从而获得该x值的的总体概率,即边缘概率。 最后一列p(y)是Y的分布,Y有1/2的概率取0,1/2的概率取1。最后一行p(x)是X的分布。 总结 通过联合分布,我们将单随机变量的分布拓展到多随机变量的分布。同样的,在单随机变量中引入的条件概率,也可以使用到多随机变量。我们还探讨了随机变量的独立性。

    1.7K90发布于 2018-01-18
  • 来自专栏深度学习之tensorflow实战篇

    在统计学中概率分布中的概率密度函数PDF,概率质量PMF,累积分布CDF

    CDF : 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。 二. 对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为 FX(x)=Pr(X≤x)=⎧⎩⎨⎪⎪0 if x<012 if 0≤x<11 if x≥1FX(x)=Pr(X≤ x)={0 if x<012 if 0≤x<11 if x≥1F_X\left( x \right) =\Pr\left ( X\leq x \right )=\begin{cases}& 0\text 对于离散型随机变量,可以直接用分布律来描述其统计规律性,而对于非离散型的随机变量,如连续型随机变量,因为我们无法一一列举出随机变量的所有可能取值,所以它的概率分布不能像随机变量那样进行描述,于是引入PDF 分布函数的意义   分布函数F(x)F(x)在点xx处的函数值表示XX落在区间(−∞,x](−∞,x]内的概率,所以分布函数就是定义域为RR的一个普通函数,因此我们可以把概率问题转化为函数问题,从而可以利用普通的函数知识来研究概率问题

    3.7K130发布于 2018-03-19
领券