首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数说工作室

    P之死

    有一天,我走进统计学的神殿 ,将所有谎言都装进原假设的盒子里, “P为零”, 一个声音传来, “但你已经不能再拒绝,因为,P已经死了” 从此,这个世界上充斥着谎言。 实际上,问题并不在数据中,而是P出了问题,正如罗斯福大学的经济学家史蒂芬所说,“P没有起到人们期望的作用,因为它压根就不可能起到这个作用。” ? 为什么呢?为什么P没有达到人们的期望? 现在和数说君一起来梳理一下P和假设检验的历史,并从中寻找答案吧。 ? 二、P和假设检验的历史 1. Fisher P能风靡学术界这么多年,费雪是第一推手,被他推动的除了P,还有被称为“费雪学派”(Fisherian)的假设检验思想。 了,因为P从来没有被证明可以用来接受某个假设,即使是拒绝假设,也是基于某个样本得出的结论,当样本变动时,结论很可能也会变动。 P检验会如此不靠谱?

    1.5K70发布于 2018-04-08
  • 来自专栏数说工作室

    【温故】P之死

    P的争论,纪念一下100年前的今天。 实际上,问题并不在数据中,而是P出了问题,正如罗斯福大学的经济学家史蒂芬所说,“P没有起到人们期望的作用,因为它压根就不可能起到这个作用。” ? 为什么呢?为什么P没有达到人们的期望? 现在和数说君一起来梳理一下P和假设检验的历史,并从中寻找答案吧。 ? 二、P和假设检验的历史 1. Fisher P能风靡学术界这么多年,费雪是第一推手,被他推动的除了P,还有被称为“费雪学派”(Fisherian)的假设检验思想。 了,因为P从来没有被证明可以用来接受某个假设,即使是拒绝假设,也是基于某个样本得出的结论,当样本变动时,结论很可能也会变动。 P检验会如此不靠谱?

    99720发布于 2018-08-02
  • 来自专栏数说工作室

    浅议P校正

    P,通常被我们用来判断是否接受一个假设,关于P的前世今生,可以看数说君的了一篇文章《P之死》,在微信公众号中回复“P”查看。 至于P是怎么来的,为什么用P和α相比来判断,可以去看《P之死》,里面已经进行了详细的梳理。 对于每一个检验的P,有: P<α=0.05/m,我们才能拒绝H0; 这样我们就校正了显著水平,当然我们也可以让α保持不变,去校正PP*m<α=0.05,我们才能拒绝H0; 也就是说,每一个检验做出来的 P,我们都要乘以m,叫做校正后的P,然后去和0.05进行比较。 或者,保持α不变,将P校正为mP(i)/i,这个又称为Q Q-value(i) = m × P(i)/i < α 根据Benjaminiand和Hochberg的论文(1995)里的证明, 以上的过程就可以控制

    7.3K61发布于 2018-04-08
  • 来自专栏祥子的故事

    统计| p的计算

    p的计算,R语言和python的实现 今天来说说频率中假设检验要依赖的评估指标:p,对,你也许很清楚的知道它表达的意思,但是它是怎么算得的呢?不知道你是否知道呢? 这次将介绍几种分布计算p的方法(套路)。 这里以两样本均值的假设检验为例来说明。 \frac{S_{y}^{2}}{m}}} \sim N(0,1) 假设检验的介绍看博客:http://blog.csdn.net/xxzhangx/article/details/67640775 p是说在原假设成立的条件下 ,原假设发生的概率,若是p小于0.05,发生概率小于0.05时,认为是小概率发生了,即是差异性显著,拒绝原假设。 公式: 双边假设的pp=P(z<−|x¯−y¯S2xn+S2ym−−−−−−−√|) p = P( z < -| \frac{ \overline{x} - \overline{y

    4K20发布于 2019-02-18
  • 来自专栏Q青之家

    QQWeb登陆P算法

    QloginPCode 腾讯WEB登陆协议p算法,node.js编写,下面是服务端源码,算法请自行去github下载 点击下载 var http = require('http'); var RequestUrl get.vcode; response.writeHeader(200, { "Content-type": "text/html;charset=utf8" }) try { var p = login.getmd5(uin, pwd, vcode); response.write(p); } catch (err) { response.write(err.toString

    70320发布于 2021-08-12
  • 来自专栏数据指象

    功效分析:P的胞弟

    学过统计学基础的同学们,对P耳熟能详,脱口而出;关于功效我们多半像个丈二和尚,摸不着头脑。 2,P与功效 P:拒绝原假设而犯错第一类错误的概率。是在【基准显著水平】做拒绝或不拒绝原假设的定性指标。 功效是:1-β(第二类错误的概率)概率来定义,它衡量真实事件发生的概率。 为什么有了P检测,还有功效检测呢?实验最重要的是提升可信度和说服力,P虽好但也不是处处皆好,所以多一个功效检测,多一道安心的保障。 4,主角的效应的开场 影响功效的因素有3个:样本大小,显著性水平,效应。 我们也说过效应是度量处理的差异程度的,不能的研究方向,不同的功效计算方法对应不同的效应计算公式。常用的公式如下 4.3,效应大小的标准?

    94140编辑于 2022-04-27
  • 来自专栏量化投资与机器学习

    ​为什么说p像根针?一场关于p的战争!

    如果你对p比较陌生,简单来说呢,p是一个告诉你是否应该认为原假设很荒谬的决策工具。 反对p 当人们(经常是贝叶斯学派)批判p的时候,通常可以归结为两种论点: 1、关于定义或公式。 支持p 你应该对那些对p怀有极端狂热的人也抱有怀疑。p只是在一些非常特定的情形下才有用。但当p有用的时候,就会不鸣则已,一鸣惊人。 p是特定方式下决策的有力工具 质疑这一点非常困难。 p的另一种情况 如果你对分析学感兴趣(不是统计学),p是一种有用的方法来汇总数据,迭代搜索。请不要像统计学家那样去解释p。除非数据内含特定的模式,否则p无法说明任何事情。 如果是为别人计算p,对你来说可能是没有用的。p应该与那些做出相同简化假设、按相同方式制定决策的人分享。 用别人的p是危险的事情……它们就像针:如果你要用,就用自己的! 这就是为什么p有点像医生用的针头。它们是供个人使用的,共用p是很危险的事情。

    70620发布于 2019-07-10
  • 来自专栏用户7627119的专栏

    【R语言】P转换成***

    我们在做一些统计学分析的时候,总是能得到一个p。但是在画图的时候,一般会把p转换成星号(*),显示在图上。那么今天小编就来跟大家聊一聊,怎么用R语言,将P转换成对应的*。 #install.packages("gtools") library(gtools) star2=stars.pval(pval) pval star2 这个函数连转换的参数都帮你省了,只需要输入p就可以了

    91530编辑于 2022-09-21
  • 来自专栏生信补给站

    scRNA分析|自定义你的箱线图-统计检验,添加p,分组比较p

    在前面scRNA分析|使用AddModuleScore 和 AUcell进行基因集打分,可视化中,基因集评分使用小提琴图或者箱线图进行展示,那如何进行统计检验以及添加P呢? 本文主要解决以下几个问题 (1)指定统计检验方式(2)指定比较组并添加P(3)任意比较(4)分组比较 (5)使用星号代替P 等 一 载入R包 数据 使用本文开始的基因集评分的结果 和 ggpubr + stat_compare_means(aes(group = group)) 三 可视化调整 除上述之外还有一些常见的小调整,比如去掉p前面的统计方法, 将P改为星号,调整坐标轴和标签等等 = paste0("p =", ..p.format..)) ) 2,将p改为星号 p1+stat_compare_means(comparisons = my_comparisons, aes(label = paste0("p =", ..p.format..)), # 只显示p大小,不呈现计算方法 color="grey50",

    6K31编辑于 2023-03-08
  • 来自专栏给永远比拿愉快

    假设检验和P那些事

    假设检验和P那些事 记得大学时候学习概率论与数理统计的时候,学习过假设检验,但我不记得课本上有提到过PP 上面讲了检验假设的一般过程,好像跟P没什么关系?但是P其实和检验假设息息相关的。上面的求解过程是通过判断样本观测是否落在拒绝域而做出判断的,其实我们还可以通过计算P直接进行判断。 那么什么是$P$呢? 我的理解就是P是在原假设成立的情况下,出现比当前样本观测值更极端(包括当前样本观测)情况的概率。 其实这样说还是挺抽象的,我们通过计算来进行说明。 计算的过程就是上面讲解假设减压和P的过程。

    1.7K10发布于 2019-01-22
  • 来自专栏生信小驿站

    绘制韦恩图及计算P

    (1)计算韦恩venn图交集的P #======================================================= #======================= 计算韦恩图P的代码为 > phyper(inter-1, a, 20000-a, b, lower.tail = F) [1] 2.098632e-06 可以看到P小于0.05,因此该overlap 计算venn图P的具体资料大家可以检索:超几何分布检验(hypergeometric test)与费歇尔精确检验(fisher's exact test); Statistical significance of the overlap between two groups of genes; Calculate venn diagram hypergeometric p value using R等。 , scaled = FALSE) pdf(file = 'venn_anti_gene.pdf', height = 5, width = 5) p

    3.3K10编辑于 2021-12-06
  • 来自专栏优雅R

    「R」ggplot2 添加矫正p

    ggpubr 实现了 ggplot2 绘图添加 p 的良好支持,但读者需要注意它是没有经常矫正的。矫正 p 需要额外的处理。 % mutate(y.position = 35) stat.test # A tibble: 3 x 9 dose .y. group1 group2 statistic p method p.adj y.position 1 0.5 len OJ VC 3.1697328 0.0064 T-test p <- ggboxplot( ToothGrowth, x = "supp", y = "len", color = "supp", palette = "jco", facet.by = "dose", ylim = c(0, 40) ) p + stat_pvalue_manual(stat.test, label = "p.adj") ?

    1.9K10发布于 2020-07-03
  • 来自专栏优雅R

    「R」ggplot 图 P 格式化

    「ggpubr」 包中的 stat_compare_means() 函数是非常常用于对 ggplot 图形添加统计比较结果的方法,近期有粉丝问到了如何对其展示的 P 进行格式化,这里简要地做一个记录。 p + stat_compare_means() 可以看到图中是以检验方法+P的结果来展示 P 的,那么该如何修改它呢? ,下面是一个简单的修改: p + stat_compare_means(aes(label = paste0("P = ", round(as.numeric(..p.format..), 1)))) 这里需要注意的是 ..p.format.. stat_compare_means 提供的说明修改 P 的位置: p + stat_compare_means(aes(label = paste0("P = ", round(as.numeric

    1.6K10编辑于 2022-01-21
  • 来自专栏Listenlii的生物信息笔记

    Nature: P到底能不能用?

    作者强调不是在呼吁禁止P。也不是说P不能在某些特定的应用中用作决策标准(例如确定一个制造过程是否满足某些质量控制标准)。 当报告P时,将以合理的精度给出它们(例如,P = 0.021或P = 0.13)——不使用星星或字母等修饰来表示统计意义,也不使用二进制不等式(P < 0.05或P > 0.05)。 作者并没有呼吁将P本身作为一种统计工具抛弃——相反,他们希望停止将P作为一种任意的显著性阈值。 一篇文章哀悼:工具已经变成了暴君。 Thetool has become the tyrant. (a) H0为真时,1000次统计检验的模拟P。分布均匀,平均5% P < 0.05(蓝色)。 (b)在H0为真时,10次试验的1 000次模拟中最小P的分布情况。 平均40%的P < 0.05(蓝色)。 在报告最显著P时,我们实际上考虑的是10个随机均匀分布的最小的分布(图1b)。 这种分布很容易计算,对于k个独立的测试,密度为k(1−x)k−1。

    1K20发布于 2021-07-30
  • 来自专栏生物信息学、python、R、linux

    ggpubr加相关性系数和p

    比如: 如果做scatter plot需要计算correlation及其对应p的话,如果不考虑ggpubr的话,可能需要先用cor()或者cor.test()函数求出correlation及p,然后在用如 + annotate("text",x = 0.2, y = 1, label = 'p.value = 0.01', size = 4)等方法注释上去。 如果用ggpubr中的stat_cor()则省事很多: library(ggplot2) library(ggpubr) data("iris") p <- ggplot(data = iris, aes hjust = 0.5)) + stat_cor(method = 'pearson', aes(x = Sepal.Width, y = Petal.Width, color = Species)) p cor2 p.digits和r.digits可以修改p和r的小数保留位数。默认是两位。 欢迎关注~ 生信编程日常

    2.5K20发布于 2020-04-01
  • 来自专栏用砖头敲代码

    php实现计算QQ空间登录的p

    流弊 就在昨天困扰了我四个月之久的QQ空间登录p的计算问题终于被解决了,众所周知QQ空间登录是四步进行的,前三步我都完成了,但是第四步涉及到一个p的计算,而我能嫖到的代码只有一个login.js, php $uin = ''; //QQ账号 $pwd = ''; //QQ密码 $vcode = ''; //vc通过QQ登录第三步来获取 $p_value = json_decode(file_get_contents ('http://api.moleft.cn/qq/p.php? $vcode),true); if($p_value['code']>0){ echo $p_value['data']; }else{ echo 'null'; } ? :1,失败:-1 msg string 返回信息 data array 获取的数据 声明 我不是小学生,没空偷你账号密码和ck,信就信,不信就Ctrl+W 如无特殊说明《php实现计算QQ空间登录的p

    1.2K10编辑于 2022-08-30
  • 来自专栏Datawhale专栏

    抛弃P,选择更直观的AB测试!

    本篇文章将简要地解释A/B测试背后的动机,并概述其背后的逻辑,以及带来的问题:它使用的P很容易被误解。 然后计算一个 p 并检查它是否在某个任意范围内,如5%。不妨选择Welch-t检验。 =False, alternative="less").pvalue:.1%}') # output: p-value: 7.8% 因为有些人对P很纠结,这里解读下它: 鉴于H₀是正确的,我们得到所观察到的或更极端的结果的机会最多是 我认为 p 的定义相当不直观——每个误解 p 的人都证明了这一点。最常见的误解如下: 蓝色更好的概率是 7.8%。(错误的!!!) 通常情况下,人们使用经典的 A/B 测试,往往会使用 p 。虽然这是统计学家熟悉的概念,但普通人经常会得到涉及 p 的混淆陈述。

    1.1K50发布于 2021-07-12
  • 来自专栏精益六西格玛资讯

    如何理解六西格玛中的P

    P广泛用于统计中,包括T检验、回归分析等。大家都知道,在假设检验中P起到非常重要的作用。为了更好理解P,先来看看什么是原(零)假设。 在假设检验中,什么是原(零)假设? 图片 什么是P? 天行健表示:P是介于0和1之间的一个数值,用来测量你的数据和原假设有多大的相符性;P表达的是,你的数据有多大的可能性呈现是一个真实的原假设? 如果P比较小(<0.05),那么你的样品(参数)有足够的证据告诉你,可以拒绝原假设,即新旧材料之间有差异; 如果P>0.05,那么我们很难下结论说新旧材料间是明显差异的,只能说没有足够的数据和证据证明差异性 ; 如果P恰好等于0.05,那么我们很难有结论说有无明显差异,在这种情况下,需要收集更多的数据来重新计算P;或者,冒着一定的风险认为新旧是有差异的。

    2K20编辑于 2023-03-10
  • 来自专栏CDA数据分析师

    统计︱P-0.05就发表,不然就去死!

    .如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。 .如果0.01<P<0.05,说明较弱的判定结果,拒接假定的参数取值。 .如果P>0.05,说明结果更倾向于接受假定的参数取值。 因此,随着计算机的发展,P的计算不再是个难题,使得P变成最常用的统计指标之一。 二、P的意义 P就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。 如果P很小,说明这种情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P越小,我们拒绝原假设的理由越充分。 总之,P越小,表明结果越显著。 ⑶统计学主要用三种α来与P比较(0.1;0.05;0.01),也可以计算出确切的P,也有人用P <0.001,至于选择哪个要看检验的应用领域。 ⑷显著性检验只是统计结论。 当目标从追寻真理,变成获得符合某个随意阈值(在许多领域0.05或更小的被认为“统计显著”)的p的时候,研究者们倾向于在数据里垂钓,使用不同的分析直到发现什么p合格的东西。

    1.4K60发布于 2018-02-24
  • 来自专栏优雅R

    数据科学20 | 假设检验和P

    假设检验思路:先根据样本数据计算一个统计量(如t、f等),再根据相应的分布计算出至少得到该统计量的P,比较P与显著性水平,最终做出结论。 对于这个二项分布例子,用P计算拒绝域会更容易。 2. PP value) P是最常用的“统计学意义”的度量,用于判定假设检验结果,也可根据不同的分布使用分布的拒绝域进行比较。 ➢P计算 1.在H0为真的情况下,得到检验统计量TS的分布; 2.根据已知的样本数据计算出TS的; 3.计算TS或出现更极端的在分布中的概率 若P比较小,说明H0为真是一个小概率事件。 称为显著性水平。计算出P后,将给定的显著性水平α与P 比较,就可作出检验的结论:P<?,在显著性水平?下拒绝H0;P>?,在显著性水平?下接受H0。 双侧检验的P为两边分别计算单侧检验得到的较小P的2倍。 二项式检验 例:一对夫妇有8个孩子,其中7个是女孩且没有双胞胎,怀疑这对夫妇生女孩概率大于0.5。

    2.2K20发布于 2020-07-03
领券