首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏小明的数据分析笔记本

    答公众号读者的问题~ggplot2气泡图的又一个小例子

    image.png 用pvalue映射大小 ggplot(df,aes(x=ID,y=log2FC, color=Class,size=pvalue))+ geom_point image.png 将数据的pvalue按照0.05分组,然后映射不同的形状 df$group<-ifelse(df$pvalue<0.05,"pvalue<0.05", image.png 现在是pvalue值大于0.05对应的是三角,pvalue值小于0.05对应的是圆圈,如果想对调位置的话 df$group<-factor(df$group,levels = c(" pvalue>=0.05", "pvalue<0.05")) ggplot(df,aes(x=ID,y=log2FC,size= <- -log2(df$pvalue) ggplot(df,aes(x=ID,y=log2FC,size=pvalue1, color=Class,shape=group)

    1.3K40发布于 2020-11-06
  • 来自专栏大数据智能实战

    具有泛化能力的句子表征模型:Gensen评测实验

    0.4242749254520813, 3.973321856075198e-34), 'spearman': SpearmanrResult(correlation=0.43689783218545136, pvalue 0.8431200046048173, 9.954996055278301e-204), 'spearman': SpearmanrResult(correlation=0.8434445060271232, pvalue 0.5085791335463655, 1.4543565654958856e-31), 'spearman': SpearmanrResult(correlation=0.5910758372570859, pvalue 0.5699883750430004, 9.450042347374515e-36), 'spearman': SpearmanrResult(correlation=0.4924898524588661, pvalue 0.6938360601407095, 3.874701942825776e-55), 'spearman': SpearmanrResult(correlation=0.70217697353048, pvalue

    1.3K40发布于 2019-05-26
  • 来自专栏软件工程师Michael

    C++动态内存

    () { double* pvalue = NULL; // Pointer initialized with null pvalue = new double; // Request memory for the variable *pvalue = 29494.99; // Store value at allocated address cout << "Value of pvalue : " << *pvalue << endl; delete pvalue; // free up the memory. the variable应该像这样删除我们刚刚创建的数组声明:delete [] pvalue;// Delete array pointed to by pvalue学习过 new 操作符的类似通用语法 pvalue对象的动态内存分配对象与简单的数据类型并无不同。

    52930编辑于 2023-08-29
  • 来自专栏大数据智能实战

    从监督数据中学习句子表示的方法InferSent评测实验

    0.4000052019135877, 3.462885123274831e-30), 'spearman': SpearmanrResult(correlation=0.4216233792066419, pvalue 0.8361361015394818, 2.880629023879036e-197), 'spearman': SpearmanrResult(correlation=0.8402638691147164, pvalue 0.6451225702420232, 1.745245780419042e-89), 'spearman': SpearmanrResult(correlation=0.6254444148388383, pvalue 0.6067283565186903, 1.75183791235942e-41), 'spearman': SpearmanrResult(correlation=0.5447835599816024, pvalue 0.729238290789293, 4.968258579217515e-51), 'spearman': SpearmanrResult(correlation=0.697597192268105, pvalue

    1.2K30发布于 2019-05-26
  • 来自专栏生信小驿站

    Python数据处理从零开始----第四章(可视化)(8)火山图目录

    来源数据分别是差异基因分析的两列指标,FoldChange和Pvalue值,根据这两个指标,我们可以把基因分为up,down和normal三种差异表达类型,然后使用python的seaborn程序绘制散点图即可 = pd.DataFrame(pvalue) result = pd.concat([fold1, pvalue1],axis=1,ignore_index=True) result.columns = ['fold','pvalue'] result['log(pvalue)'] = -np.log10(result['pvalue']) # In[*] result['sig'] = 'normal ' result['size'] =np.abs(result['fold'])/10 result.loc[(result.fold> 1 )&(result.pvalue < 0.05),' (x="fold", y="log(<em>pvalue</em>)", hue='sig', hue_order = ('down

    1.1K20发布于 2018-12-13
  • 来自专栏生信技能树

    一个通路居然在上下调基因集里面都富集到了

    set.seed(123456) df=data.frame( pathway=c(sample(LETTERS,10), sample(LETTERS,10)), pvalue = -log10(dat$pvalue) dat$pvalue <- dat$pvalue*dat$group dat=dat[order(dat$pvalue,decreasing = F),] p_kegg<- ggplot(dat, aes(x=reorder(pathway,order(pvalue, decreasing = F)), y=pvalue, fill=group)) + geom_bar(stat="identity", width=0.8) .1 ,所以需要改回来 name.y <- substr(df$pathway,1,1) names(name.y) <- df$pathway ggplot(df,aes(x=pathway,y=pvalue

    2.8K30编辑于 2022-01-10
  • 来自专栏小明的数据分析笔记本

    跟着Nature microbiology学作图:R语言ggplot2分组箱线图/wilcox秩和检验

    分组做wilcox秩和检验 datj %>% pull(`ID type`) %>% unique() -> group.info pvalue.df<-tibble(x=character (), pvalue=numeric()) for(info in group.info){ datj %>% filter(`ID type`==info , x=info, pvalue=a$p.value) -> pvalue.df } min_p<-min(pvalue.df %>% filter(pvalue =0) %>% pull(pvalue)) pvalue.df %>% mutate(new_p=case_when( pvalue == 0 ~ min_p, TRUE ~ pvalue )) ->pvalue.df 画图展示结果 library(RColorBrewer) scale_color_distiller() p.top<-ggplot(data

    94830编辑于 2023-08-23
  • 来自专栏大数据智能实战

    句子向量的统一评测工具(senteval)实验

    0.6620895325802911, 8.704721430530268e-96), 'spearman': SpearmanrResult(correlation=0.6750394553249758, pvalue 0.4912903255483829, 2.9163416767196783e-29), 'spearman': SpearmanrResult(correlation=0.5876587748420119, pvalue 0.5702570999692081, 6.617653256903035e-66), 'spearman': SpearmanrResult(correlation=0.6105547749196286, pvalue 0.3671091256839152, 2.084383802491154e-13), 'spearman': SpearmanrResult(correlation=0.369809532853287, pvalue 0.5442460848306432, 3.90186680777711e-19), 'spearman': SpearmanrResult(correlation=0.55899562906314, pvalue

    2K30发布于 2019-05-26
  • 来自专栏R语言学习

    表达差异基因分析

    plotMA(res) #画火山图,横轴是标准化后的平均readscount,纵轴是差异倍数,大于0是上调,小于0是下调,蓝色点表示显著差异的基因 image.png 8使用ggplot自己绘制火山图 > pvalue <-res$padj > pvalue<-as.matrix(pvalue) > fc<-res$log2FoldChange > fc<-as.matrix(fc) > df<-data.frame( pvalue,fc) > df<-na.omit(df,cols=c("pvalue","fc")) 这里去掉pvalue或fc列有NA值得行 > df$threshold[df$pvalue < 0.05 & df$fc>0 ] = "up" > df$threshold[df$pvalue < 0.05 & df$fc<0 ] = "down" > df$threshold[df$pvalue > 0.05 & df$fc>=0|df$fc<=0 ] = "non" > image.png > ggplot(df,aes(x=fc,y=-log10(pvalue)))+ + xlab(

    1.6K00发布于 2020-09-22
  • 来自专栏张善友的专栏

    设置系统环境变量立即生效的VBS脚本

    ) Dim ExistValueOfPath IF pValue <> "" Then ExistValueOfPath = pSysEnv(pPath) IF Right( pValue, 1) = "\" Then pValue = Left(pValue, Len(pValue)-1) If IsMatch(ExistValueOfPath, "\*?" & Replace(pValue, "\", "\\") & "\\? (\b|;)") Then Exit Sub '已经存在该环境变量设置 If ExistValueOfPath <> "" Then pValue = ";" & pValue pSysEnv(pPath ) = ExistValueOfPath & pValue Else pSysEnv.Remove(pPath) End IF End Sub '--------设置TOF目录--

    2.2K100发布于 2018-01-19
  • 来自专栏R语言数据分析指南

    R优雅的进行统计分析(2)自定义添加统计信息

    ❝本节来介绍如何使用R语言来做统计分析,通过「rstatix」包进行统计检验,完全使用tidyverse体系进行数据清洗及可视化,使用add_pvalue,stat_pvalue_manual两个函数来自定义添加 margin(t = 5)), legend.position = "non") } 数据可视化(1) ❝此次抛弃了上文通过geom_text()添加显著性标记的方法,改用add_pvalue ymin = value_mean - sd),width = 0.1,color = "grey30")+ geom_col(width=0.4,aes(fill=dose))+ add_pvalue 而言stat_pvalue_manual的功能更加丰富,hide.ns = T移除不显著的信息 ❞ ToothGrowth %>% mutate(dose=as.factor(dose)) %>% (stat.test2,label = "p.adj.signif",label.size=6,hide.ns = T)+ stat_pvalue_manual(stat.test3,label =

    1.1K30编辑于 2022-09-21
  • 来自专栏appuploader使用操作流程

    如何用C++进行动态内存的转换

    我们可以按照下面的语句使用 new 运算符来完成这点: double* pvalue = NULL; // 初始化为 null 的指针 pvalue = new double; // 为变量请求内存 在任何时候,当您觉得某个已经动态分配内存的变量不再需要使用时,您可以使用 delete 操作符释放它所占用的内存,如下所示: delete pvalue; // 释放 pvalue 所指向的内存 cout << "Value of pvalue : " << *pvalue << endl; delete pvalue; // 释放内存 return ,如下所示: char* pvalue = NULL; // 初始化为 null 的指针 pvalue = new char[20]; // 为变量请求内存 要删除我们刚才创建的数组,语句如下: delete [] pvalue; // 删除 pvalue 所指向的数组 下面是 new 操作符的通用语法,可以为多维数组分配内存,如下所示: ​​一维数组​​ // 动态分配,数组长度为

    78530编辑于 2023-04-17
  • 来自专栏iOS打包,上架知识大全

    如何进行C++动态转换

    我们可以按照下面的语句使用 new 运算符来完成这点: double* pvalue = NULL; // 初始化为 null 的指针 pvalue = new double; // 为变量请求内存 在任何时候,当您觉得某个已经动态分配内存的变量不再需要使用时,您可以使用 delete 操作符释放它所占用的内存,如下所示: delete pvalue; // 释放 pvalue 所指向的内存 cout << "Value of pvalue : " << *pvalue << endl; delete pvalue; // 释放内存 return ,如下所示: char* pvalue = NULL; // 初始化为 null 的指针 pvalue = new char[20]; // 为变量请求内存 要删除我们刚才创建的数组,语句如下: delete [] pvalue; // 删除 pvalue 所指向的数组 下面是 new 操作符的通用语法,可以为多维数组分配内存,如下所示: 一维数组 // 动态分配,数组长度为 m

    72330编辑于 2023-03-22
  • 来自专栏青青青山的学习笔记

    基因集富集分析(GSEA)及其可视化

    ')colnames(deg)head(deg)#得到差异基因列表后取出 ,p值和logFCnrDEG=deg[,c(2,1)]colnames(nrDEG)=c('log2FoldChange','pvalue (dat)dat$pvalue = -log10(dat$pvalue)dat$pvalue=dat$pvalue*dat$group dat=dat[order(dat$pvalue,decreasing > 0.4,];up_kegg$group=1dat=rbind(up_kegg,down_kegg)colnames(dat)dat$pvalue = -log10(dat$pvalue)dat$pvalue =dat$pvalue*dat$group dat=dat[order(dat$pvalue,decreasing = F),]library(ggplot2)g_kegg<- ggplot(dat, aes(x=reorder(Description,order(pvalue, decreasing = F)), y=pvalue, fill=group)) + geom_bar(stat="identity

    13.1K23编辑于 2022-07-04
  • 来自专栏Pou光明

    扩展和嵌入Python之获取程序出错信息

    (&ptype,&pvalue,&ptraceback); PyErr_NormalizeException(&ptype,&pvalue,&ptraceback);(可有可无) if(pvalue ,&pvalue,&ptraceback); if(pvalue) { PyObject *pstr = PyObject_Str(pvalue); 在这里看到了PyErr_Fetch(&ptype,&pvalue,&ptraceback)该函数是如何使用的,需要先“编译”python文件,在编译过程中出错才可以调用该函数捕获出错信息。 PyErr_NormalizeException(&ptype,&pvalue,&ptraceback)该函数用于将异常信息格式化输出,根据需要来使用。不使用的话会捕获到更原始的信息。 Pvalue捕获的是出错的内容,有时也会有行号。 至此,程序简单说明结束。下面给出脚本内容以及捕获的具体出错内容。 ? ?

    1.1K30发布于 2019-07-30
  • 来自专栏c语言与cpp编程

    C++ 动态内存

    我们可以按照下面的语句使用 new 运算符来完成这点: double* pvalue = NULL; // 初始化为 null 的指针pvalue = newdouble; // 为变量请求内存 = NULL; // 初始化为 null 的指针 pvalue = newdouble; // 为变量请求内存 *pvalue = 29494.99; // 在分配的地址存储值 cout << "Value of pvalue : " << *pvalue << endl; deletepvalue; // 释放内存 return 0; ,如下所示: char* pvalue = NULL;// 初始化为 null 的指针 pvalue =newchar[20];// 为变量请求内存 要删除我们刚才创建的数组,语句如下: delete [] pvalue;// 删除 pvalue 所指向的数组 下面是 new 操作符的通用语法,可以为多维数组分配内存,如下所示: 一维数组 // 动态分配,数组长度为 mint *array=newint

    97610发布于 2020-12-02
  • 来自专栏微生态与微进化

    组间差异分析:Metastats

    22) Position=factor(kms$cluster) newotu=data.frame(Group=Position, otu) #进行多重Kruskal-Wallis秩和检验与p值校正 pvalue =t(otu)[,1:2] colnames(pvalue)=c("p-value", "q-value") for (i in 2:ncol(newotu)) { t=kruskal.test(newotu [,i]~newotu[,1]) pvalue[i-1,1]=t$p.value } pvalue[,2]=p.adjust(pvalue[,1], method="BH", n=nrow(pvalue )) pvalue=pvalue[order(pvalue[,1]),] 接下来我们可以筛选显著差异的物种并进行可视化: #筛选q小于0.05的物种 top=pvalue[pvalue[,2]<0.05

    2.2K10编辑于 2022-05-05
  • 来自专栏DrugOne

    Python生物信息学⑥绘制热图及火山图

    绘制火山图 (1)第一步制作差异分析结果数据框 genearray = np.asarray(pvalue) result = pd.DataFrame({'pvalue':genearray,'FoldChange ':fold}) result['log(pvalue)'] = -np.log10(result['pvalue']) (2)第二步制作火山图的准备工作 选定的差异基因标准是 I.差异倍数的绝对值大于 < 0.05),'sig'] = 'up'result.loc[(result.FoldChange< -1 )&(result.pvalue < 0.05),'sig'] = 'down' ax = 筛选差异基因 fold_cutoff = 1pvalue_cutoff = 0.05 filtered_ids = []for i in range(0, number_of_genes): if (abs(fold[i]) >= fold_cutoff) and (pvalue[i] <= pvalue_cutoff): filtered_ids.append(i) filtered

    2.4K31发布于 2021-01-28
  • 来自专栏python3

    利用python进行T检验

    stats.ttest_1samp(rvs, [1, 2]) 返回结果: Ttest_1sampResult(statistic=array([ 2.0801775 , 2.44893711]), pvalue 不拒绝原假设——均值等于5 stats.ttest_1samp(rvs, 5.0) Ttest_1sampResult(statistic=array([-0.68014479, -0.04323899]), pvalue ——均值不等于5 stats.ttest_1samp(rvs, 0.0) Ttest_1sampResult(statistic=array([ 2.77025808, 4.11038784]), pvalue ,可以直接检验 不拒绝原假设——两总体均值相等 stats.ttest_ind(rvs1,rvs2) Ttest_indResult(statistic=0.26833823296238857, pvalue stats.levene(rvs1, rvs2) LeveneResult(statistic=1.0117186648494396, pvalue=0.31473525853990908) p值远大于

    2.8K30发布于 2020-01-13
  • 来自专栏python与大数据分析

    关于数据质量管理之正态分布验证

    =stats.normaltest(x) kstestvalues.append(pvalue) kstestvaluesflag.append(True if pvalue (pvalue) kstestustdvaluesflag.append(True if pvalue > 0.05 else False) statistic, pvalue =stats.normaltest(x) normaltestvalues.append(pvalue) normaltestvaluesflag.append(True if pvalue > 0.05 else False) statistic, pvalue =stats.shapiro(x) shapirovalues.append (pvalue) shapirovaluesflag.append(True if pvalue > 0.05 else False) dtdesc.loc['kstestvalues

    59930编辑于 2022-03-11
领券