诡异的R包Hmisc安装错误: unexpected '<'1: < ^ ERROR: unable to collate and parse R files for package 这是安装包的结尾字符和安装平台不一致导致的 #Hmisc package_url="https://cran.r-project.org/src/contrib/Archive/Hmisc/Hmisc_4.8-0.tar.gz" install.packages
R导入SAS数据集可以使用 foreign 包中的 read.ssd() 和 Hmisc 包中的 sas.get() 。 R导入SPSS数据集可以通过 foreign 包中的 read.spss()函数 或者Hmisc 包中的 spss.get() 函数。 【温馨提示】foreign包和Hmisc包都是的R的扩展包,因此在使用之前,若是 没有安装,需要先安装。安装好后,加载成功后,即可以使用包里面的函数。
语言相关性分析和结果可视化简单小例子, B站的链接是 https://www.bilibili.com/video/BV1Ne41147eR 有朋友在公众号留言遇到了一些问题,今天记录一下问题中我能够解决的两个 第一个问题是 使用Hmisc 包中的rcorr()函数做相关性分析,他的数据是4行5列,其中有一行数据有两个缺失值 我用R语言自带的数据集iris试一下,首先是取数据的前四行和四列 df<-iris[1:4,1:4] 相关性性分析 Hmisc ::rcorr(as.matrix(df)) 就会遇到报错 Error in Hmisc::rcorr(as.matrix(df)) : must have >4 observations 这个报错的意思应该是你的数据最少有 另外的一个知识点:如果想要用某个包里的函数,有两种办法,第一种办法是先使用library()函数加载这个包,然后直接输入函数名;另外一种办法是不加载,直接使用包名+两个冒号+函数,比如Hmisc::rcorr
complete.obs") 相关性结果: 上面还有一个缺陷,没有给出显著性检验,默认的cor.test只能对两个变量进行显著性检验,比如: cor.test(dd[,1],dd[,2]) 1.2 使用Hmisc 包中的rcorr函数 Hmisc包中的rcorr函数可以对多个变量进行相关性计算,并且计算显著性。 library(Hmisc) dd = as.matrix(dd) rcorr(dd) 结果如下: > rcorr(dd) dj dm wd h1 h2 h3 (-c(1:5)) head(dd) # 相关系数 cor(dd) cor(dd,use = "complete.obs") cor.test(dd[,1],dd[,2]) library(Hmisc
psych包 install.packages("psych") library(psych) corr.test(mtcars) 得到特征两两之间的相关系数如下 同时也能得到相关性的p值 四、Hmisc 包 #安装Hmisc包 install.packages("Hmisc") library(Hmisc) rcorr(as.matrix(mtcars)) 得到特征两两之间的相关系数如下 同时也能得到相关性的
我们需要准备相应的R包包括:survival (用于cox模型建立),survminer (用于cox模型诊断结果的可视化),Hmisc/compare (C-index值的获取)。 Hmisc包中主要函数: rcorr.cens 计算C-index值 ? compareC中的函数 ? 3. C-index的R软件实现有两种方法,一种是用到Harrell本人的的R包Hmisc ;另一种是Le Kang, Weijie Chen 2014年12月18日发布的compareC。
complete.obs") 相关性结果: 上面还有一个缺陷,没有给出显著性检验,默认的cor.test只能对两个变量进行显著性检验,比如: cor.test(dd[,1],dd[,2]) 1.2 使用Hmisc 包中的rcorr函数 Hmisc包中的rcorr函数可以对多个变量进行相关性计算,并且计算显著性。 library(Hmisc) dd = as.matrix(dd) rcorr(dd) 结果如下: > rcorr(dd) dj dm wd h1 h2 h3 (-c(1:5)) head(dd) # 相关系数 cor(dd) cor(dd,use = "complete.obs") cor.test(dd[,1],dd[,2]) library(Hmisc
答案二:使用Hmisc的impute函数 我给出的点评是:这样的偷懒大法好!使用Hmisc的impute函数可以输入指定值来替代NA值做简单插补,平均数、中位数、众数。 d=c(sample(1:40,9),NA), e=c(sample(1:50,5),NA,NA,NA,NA,NA)) library(Hmisc
0.610655 0.7260237 0.42314646 kurtosis -0.372766 -0.1355511 -0.02271075 拓展:一些与描述统计相关的包,例如:Hmisc > library(Hmisc) 载入需要的程辑包:grid 载入需要的程辑包:lattice 载入需要的程辑包:survival 载入需要的程辑包:splines 载入需要的程辑包:Formula 载入程辑包 :‘Hmisc’ 下列对象被屏蔽了from ‘package:base’: format.pval, round.POSIXt, trunc.POSIXt, units > describe(mtcars 5.424 ———————————————————————————————————————– > library(psych) 载入程辑包:‘psych’ 下列对象被屏蔽了from ‘package:Hmisc
上图3 03 — 多变量与多变量相关Hmisc::rcorr > dt <- iris[,-5]> library(Hmisc)> res<-rcorr(as.matrix(dt)) #此处需将原始数据转换为矩阵 = rownames(cormat)[col(cormat)[ut]],+ cor =(cormat)[ut],+ p = pmat[ut]+ )+ }> > library(Hmisc
,请删除‘#’来导入: # install.packages("tidyverse") # install.packages("funModeling") # install.packages("Hmisc 现在加载所需的程序包 library(funModeling) library(tidyverse) library(Hmisc) tl; dr(代码) 使用以下函数一键运行本文中的所有函数 更多相关信息请浏览: https://livebook.datascienceheroes.com/exploratory-data-analysis.html 第四步:同时分析数值和分类变量 使用Hmisc library(Hmisc) describe(data) ## data ## ## 4 Variables 303 Observations ## -------------
"CD68", "CD79A") genes_to_check genes_to_check=str_to_title(genes_to_check) genes_to_check 大家也可以选择Hmisc 包的capitalize函数,代码如下: library(Hmisc) genes_to_check = c("PTPRC","EPCAM", 'MME',"CD3G","CD3E", "CD68",
library(rms) ## 载入需要的程辑包:Hmisc ## 载入需要的程辑包:lattice ## 载入需要的程辑包:survival ## 载入需要的程辑包:Formula ## 载入需要的程辑包 :ggplot2 ## Warning: 程辑包'ggplot2'是用R版本4.1.3 来建造的 ## ## 载入程辑包:'Hmisc' ## The following objects are masked Setting direction: controls < cases plot(roc.plot,legacy.axes=T) plot of chunk unnamed-chunk-6 方法4 使用Hmisc library(Hmisc) somers2(tmp$predvalue, tmp$dead) ## C Dxy n Missing #
require("Hmisc")) install.packages("Hmisc") if(! survminer", "lars", "glmnet", "timeROC", "ggpubr", "randomForest", "ROCR", "genefilter", "Hmisc
", c("a","b"), lty=c(1,2),pch=c(15,17),col=c("red","blue"),cex=0.5) install.packages("Hmisc ") library(Hmisc) minor.tick(nx=3,ny=3,tick.ratio=0.5) par(opar) #综合2:数据点右侧文字设置 with(mtcars,{plot(wt
但是mRNA的表达量有上万个,用这个函数计算的时候是非常慢的 找到了另外一个函数是Hmisc这个包中的rcorr()函数 这个速度快很多,但是他不能计算两个数据集之间变量的相关性, 这样的话可以先计算, 然后再筛选 这个函数要求的输入数据是矩阵格式 Hmisc::rcorr(as.matrix(df1),as.matrix(df2)) ?
英文字符 方案一 library(foreign) mydata=read.spss("data.sav") 方案二 library(Hmisc) data=spss.get("data.sav
calibration 方法1 calibration 方法2 加载R包和数据 library(survival) library(rms) ## Loading required package: Hmisc # Loading required package: Formula ## Loading required package: ggplot2 ## ## Attaching package: 'Hmisc library(dplyr) ## ## Attaching package: 'dplyr' ## The following objects are masked from 'package:Hmisc
session_info(packages = c( "tidyverse", "readxl", "gtsummary", "stringr", "writexl", "psych", "rstatix", "Hmisc en_US.UTF-8 / C / en_US.UTF-8 / en_US.UTF-8#> #> Package version:#> DT_0.33 gtsummary_1.7.2 Hmisc
header = T) head(data) str(data) rt <- data %>% mutate_at(vars(NFE2L2:NFE2L2), funs(Hmisc 我们通过Hmisc::cut2(as.numeric(.), g = 3)),将患者均分为三组,但是虽然P值下降了,仍然没有达到想要的(P<0.05)的效果。所以,我们需要其他方法。