首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏优雅R

    数据科学23 | 统计推断-多重检验

    当我们进行数据分析时,有时候需要反复进行假设检验,使用多重检验校正可以避免假阳性的发生,主要包括误差测量和校正。

    2.3K21发布于 2020-07-03
  • 来自专栏优雅R

    数据科学22 | 统计推断-多重检验

    统计分析时进行多次假设检验,多重检验校正可以降低假阳性结果的发生。 ➢校正显著性水平?

    1.3K11发布于 2020-07-03
  • 来自专栏优雅R

    数据科学18 | 统计推断-渐近性

    渐近性(asymptopia)是样本量接近于无穷大时统计行为的一个术语。渐近统计即大样本统计主要研究当样本量n→∞时统计方法的有关渐进性质。渐近性有助于简单的统计推断和估计,也是频率解释概率的基础。

    2.9K30发布于 2020-07-03
  • 来自专栏优雅R

    数据科学16 | 统计推断-概率和条件概率

    统计学一般分统计描述及统计推断两部分。 统计描述是通过图表或数学方法,对数据资料进行整理后描述数据的客观规律,而统计推断则是使用从总体中随机抽取的数据样本,用样本数据总结的规律去对总体的未知特征进行推断。 本章主要学习统计推断常见的概念及相关基础内容。 1. 概率(probability) 概率衡量一个随机事件发生在所有事件的集合里占的比重,是对随机事件发生的可能性的度量。 通常不直接用密度计算分位数,在R中,统计函数名前面加上q,表示分位数函数。qbeta( )返回?分布的分位数。 将样本的观测值从最小到最大排序,取中位数,就是样本中位数。 统计推断目标是用样本估计总体,样本中位数将估计总体中位数;样本均值将估计总体均值;样本标准差将估计总体标准差,等等。 2.

    1.4K10发布于 2020-07-03
  • 来自专栏云深之无迹

    统计推断-样本分布碎碎念

    啥是分布,先不说三大分布,就说真实的汉语意思:(得到精确的分布就是统计的目的) 就是散布的意思 比如这样 OK,我们从一堆东西,也就是样本中尽量提取出一些信息出来,这些信息统称为统计量,完全由样本所决定的量叫作统计量 想法是,我们现在现在先猜是属于正态分布的,但是两个参数不知道: 在统计中总体是未知的,是需要通过样本来推断的,所以用虚线和灰色来表示(总体的分布未知,总体的参数μ、σ^2也未知). 有偏差 嗷嗷 我这里插个大数定理,一个定理一个推论 其实这个就是说的独立同分布的中心极限定理 一些推导 或者直接记住这个,其实书上还有两个,不考,就不写 正态分布态广泛了,这些样本的整体可以构造好多统计量 大概就是这样 两个卡方组一个F 图像如此 三大分布完事以后,继续讨论统计量的分布,上面说了均值,现在是方差。 surface键盘真垃圾 比耶,两天学完数理统计

    29710编辑于 2024-08-21
  • 来自专栏数据派THU

    【经典书】统计学中的因果推断

    来源:专知本文为书籍介绍,建议阅读5分钟本文为你介绍统计学中的因果推断。 Causal Inference in Statistics: A Primer一书的分享解读主要被分为四个部分: 第一部分:从宏观角度分析了因果科学的研究意义,巩固了统计学的基础知识,包括变量、概率、

    65530编辑于 2022-06-16
  • 来自专栏c/c++的学习笔记

    python数据分析——数据分析的统计推断

    在进行数据分析的统计推断时,我们还需要关注一些潜在的陷阱和误区。例如,过度拟合、样本偏差、数据造假等问题都可能影响推断结果的准确性。 三、统计推断 统计推断包括:对总体的未知参数进行估计,对关于参数的假设进行检查和验证,对总体进行预测。科学的统计推断所使用的样本,通常通过随机抽样方法得到。 统计推断的理论和方法论的基础是来自于概率论和数理统计学。统计推断的一个基本特点是其所依据的条件中包含有带随机性的观测数据。 如何理解带随机性的观测数据? 四、统计推断步骤 那么我们如何进行统计推断?当我们获得有效样本数据后,统计推断问题可以按照如下的步骤进行: 步骤1:确定用于统计推断的合适统计量。 步骤2:寻找统计量的精确分布。 步骤4:根据统计推断结果对问题作出解释。 统计推断的基本问题可以分为两大类: 一类是参数估计问题,包括点估计和区间估计; 另一类是假设检验问题。我们将分别进行介绍。

    91210编辑于 2024-03-20
  • 来自专栏信数据得永生

    数据科学 IPython 笔记本 六、SciPy 统计推断

    六、SciPy 统计推断 原文:statistical-inference-scipy 译者:飞龙 协议:CC BY-NC-SA 4.0 6.1 效应量 署名:派生于 Allen Downey 现在我们可以计算样本统计量,如均值和标准差。 给定d(并假设分布是正态),你可以计算重叠,优势和相关统计量。 总之,报告效应量的最佳方式通常取决于受众和你的目标。通常在具有良好技术属性的摘要统计量,和对一般受众有意义的统计量之间进行权衡。 Cohen 的d等统计量是其他统计数据的比率,相对难以分析。 但是通过计算方法,所有样本统计量都同样“容易”。 关于词汇的一个注解:我在这里称之为“重采样”的东西,是一种称为“自举”的特定重采样。 在正常情况下,我们也可以推断出表观效应不太可能是由随机抽样引起的。 最后一点:在这种情况下,我会报告p值小于 1/1000 或 0.001。

    1.1K30编辑于 2022-05-07
  • 来自专栏优雅R

    数据科学17 | 统计推断-期望方差和常见概率分布

    统计推断中,用样本均值估计总体分布的均值(期望值),样本量越多,样本均值约接近总体均值。 例:HistData包中的Galton数据集,包括父母和孩子的身高。 之间距离平方的期望:统计描述中,总体方差 ;样本方差 。 ?为总体均值, 为样本均值。 ・样本方差 以估计总体方差 。 样本方差也是一个随机变量,样本方差的期望值是它试图估计的总体方差。

    2.1K20发布于 2020-07-03
  • 因果推断新方法:识别统计异常值的根源

    异常值问题是统计学中最古老的问题之一,已成为学术研究超过一个世纪的主题。尽管在检测异常值方面已有很多工作,但缺乏一种形式化的方式来定义异常值的“根本原因”。

    14410编辑于 2026-01-26
  • 来自专栏BioIT爱好者

    癌症中克隆种群结构统计推断分析软件PyClone安装小记

    PyClone 是一种用于推断癌症中克隆种群结构的统计模型。 #11628 anaconda-issues,#6678 aroth85/pyclone,GitHub YTer,Pyclone 说明,Hexo 个人博客 用户1680321,安装使用pyclone进行克隆演化推断

    3.9K20发布于 2018-11-01
  • 来自专栏java架构学习交流

    概率分析方法与推断统计(来自我写的python书)

    在数据分析统计的场景里,常用的方法除了描述性统计方法外,还有推断统计方法,如果再从工作性质上来划分,推断统计包含了参数估计和假设验证这两方面的内容。 而推断统计用到了很多概率统计方法,所以本小节在介绍推断统计的内容前,还将讲述一些常用的概率统计方法。 从统计学的角度来分析,样本密度越大的数值区域,接下来的数据出现在这里的概率也就越大。 2 用直方图来拟合正态分布效果 正态分布是一种连续随机变量概率分布,它是很多分析统计方法的基础,比如包括回归分析等在内的多种方法均要求被分析的样本服从正态分布。 4 参数估计方法 参数估计方法是推断统计的一种方法,该方法的理论基础是正态分布,也就是说,如果该方法的适用范围是满足正态分布的序列。

    1.1K10发布于 2021-03-02
  • 来自专栏优雅R

    数据科学19 | 统计推断-t分布置信区间

    偏态分布的数据不满足t分布置信区间的假设,置信区间的中心落在均值处没有意义,可以考虑使用对数处理数据,或使用其他统计量如中位数。 画出原始数据: meanweight<-ChickWeight %>% group_by(Time,Diet) %>% summarise(weight = mean(weight)) #按Time统计 实际上,方差不齐的独立样本的相关标准化统计量不服从t分布,当其自由度用这种方式计算下才近似t分布。 例:比较8名口服避孕药及21名空白对照患者的血压。

    4.2K20发布于 2020-07-03
  • 来自专栏AI科技大本营的专栏

    课程 | 8小时搞定机器学习之概率与统计推断

    没错,我们的美女老师冒老师要开新课啦~~~专门为你排忧解难,解决各大数学问题——《机器学习之概率与统计推断》在等你哦! 概率与机器学习算法? 抢先体验冒老师的讲课风格,超?????好评

    73980发布于 2018-04-26
  • 基于代理似然函数的随机图统计推断技术解析

    Graphs With a Surrogate Likelihood Function Dingbo Wu, Fangzheng Xie; 26(230):1−65, 2025.摘要谱估计器已被广泛应用于统计网络分析 本文提出了一种用于一类流行网络模型(称为随机点积图)统计推断的新型代理似然函数。与结构复杂的精确似然函数相比,该代理似然函数具有可分离结构和对数凹性,同时能很好地逼近精确似然函数。

    6700编辑于 2026-01-12
  • 来自专栏医学和生信笔记

    多变量数据的统计描述和统计推断(hotelling-T检验、多元方差分析、轮廓分析)

    本章的所有统计描述与统计推断都与单变量分析有关,如单变量均数、单变量方差、单变量t检验、单变量方差分析等,只是采用了适合多个反应变量的向量和矩阵的表示方法。 本章介绍的多变量数据的统计描述和统计推断方法是多元统计分析的基础,多元统计分析方法主要包括以下几种:聚类分析、主成分分析、因子分析、判别分析、结构方程模型等。 如果你接触过机器学习,那么你一定听过无监督方法,主成分分析这种方法在机器学习领域就属于无监督方法,但是在统计学领域它属于多元统计分析方法。 unsetunset多元正态分布unsetunset 在单变量统计描述和推断中,通常假定数据服从正态分布。同理,在多变量统计描述和推断中,也是通常假定数据服从多元正态分布。 height ## 3.64750 51.66667 ## ## $`2` ## weight height ## 3.148571 48.571429 下面进行多变量的统计推断

    16010编辑于 2026-03-17
  • 来自专栏机器学习与统计学

    Duke@coursera 数据分析与统计推断 unit3 foundations for inference

    A plausible range of values for thepopulation parameter is called a confidence interval.

    91310发布于 2019-04-10
  • 来自专栏文渊之博

    因果推断

    前言 Judea Pearl是图灵奖得主,因果推断的奠基人之一。 由于阅读的论文中涉及到反事实推断中Total Effect(TE), Natural Direct Effect(NDE), Total Indirect Effect(TIE)等概念,涉及到反事实推断方法的核心 Y的平均自然直接效应为: NDE(x,x∗;Y)=Eu(Yx,Zx∗)−Eu(Yx∗)(6) 3.4 自然直接效应:识别 从观测数据中,无法直接估计自然直接效应,换句话说,自然直接效应无法被直接转化为统计量 x;Y)(13)(14) 在线性系统中,有: TE(x,x∗;Y)=NDE(x,x∗;Y)+NIE(x,x∗;Y)(15) 要特别注意,上式只适用于线性模型,另一篇最新的文章给出了定量分析,详见【因果推断论文

    89331编辑于 2023-03-19
  • 来自专栏机器学习与统计学

    Duke@coursera 数据分析与统计推断 unit2 probability and distributions

    In a random process we know what outcomes couldhappen, but we don't know which particular outcome will happen

    69120发布于 2019-04-10
  • 来自专栏数据派THU

    因果推断入门:为什么需要因果推断

    1.2 因果推断的应用 因果推断对科学来说是至关重要的,因为我们经常想提出因果要求,而不仅仅是关联性要求。 相比之下,许多统计数据都是关于解决有限样本中的不确定性。当给定无限数据时,没有不确定性。然而,关联是一个统计概念,并不是因果关系。即使拥有无限数据,在因果推断方面还有更多工作要做。  2.2 因果推断中的基本问题 因果推断中的基本问题是,如果通过缺失数据来得到因果效应。即我们不能同时观察到  和 ,那么我们就不能得到 ,就判断不了因果效应。 再来介绍一个概念:identifiability 如果可以把一个因果效应的表达式减少到一个纯粹的统计表达式,只使用统计符号,如 T、X、Y,期望,和条件来表示,则意味着因果量  是可识别的。 常见的贝叶斯网络是纯粹的统计模型,所以我们只谈论贝叶斯网络中的关联流动。

    2.6K24编辑于 2022-09-14
领券