拼图软件 patchwork 图片导出 经典三段函数 ggsave eoffice topptx base 作图 head(iris) plot(iris[,2],iris[,3],col = iris[,5] points() 添加点 axis() 坐标轴 title() 添加标题 text() 添加文字 ggplot2 作图 ggplot2是与base r语言不同的作图语法
(文中图片引用于生信技能树小洁老师PPT,仅用于自己学习,不用于商业目的,如有侵权,立即删除)Part5 文件读写1. 用project管理工作目录不然就会报错!!!! 2.1 读取ex1.txt 发现了问题,要从帮助文档里找参数解决 03 read_edit_write.R 数据框导出4. other.R 用于读取和导出文件的R包 data.table读取 记忆卡片Part6 R语言作图 常用的可视化 R包和函数 1. plot.R 基础包,绘图函数 ggplot2与ggpubr2. ggplot2.R ggplot2.R语法ggplot2-1.入门级绘画模板ggpolr2特殊语法
read.table 数据框读取 read.csv("doudou.txt") 意外的对x变量进行table 发现看不懂得到的东西 用gpt进行询问: 如果你只使用 table(x),而没有指定具体的列,R语言将会默认对数据框中的每一列进行频数统计
常用可视化R包和函数 1,作图 base ggplot2 ggpubr 2,拼图 par里的mfrow grid.arrange cowplot patchwork 3,导出 经典三段论 ggsave #https://mp.weixin.qq.com/s/p7LLLvzR5LPgHhuRGhYQBQ 拼图 图片 图片 可以在STHA网站找到现成的代码。 2、搜索画图代码 3、仿制示例数据 4、套代码,调整细节 玩转字符串 str_length() length()#向量里面元素的个数 str_split() str_sub(x,5,9)#提取5-9的元素 file_name x = x[colnames(y),] colnames(y) = x$ID # 2.一些搞文件的函数---- dir() # 列出工作目录下的文件 dir(pattern = ".R$ ") #列出工作目录下以.R结尾的文件 file.create("douhua.txt") #用代码创建文件 file.exists("douhua.txt") #某文件在工作目录下是否存在 file.remove
length(x) 是 R 语言中的基本函数,用于计算一个对象(如向量、列表等)中元素的数量。 R语言中,select函数用于选择数据框中的列,可以使用列名或者向量来指定要选择的列。 " "vemurafenib" str_to_lower(g[,4])#注释1在R语言中,str_to_lower()函数是由stringr包提供的函数,而tolower()函数是R的基础函数之一。 (1000) %>% names() #注释在R语言中,head()和tail()函数用于查看数据框或向量的前几行或后几行。 "3_条件和循环.R" ## [5] "4_表达矩阵画箱线图.R" "5_隐式循环.R" ## [7] "6_两个数据框的连接.R" "7_一些顶呱呱的函数.R" ##
(5),rnorm(5,1)) > x [1] 0.61008707 0.81746169 -1.09859969 -1.78134612 -1.94262725 0.99760581 [7] mean) $`1` [1] -0.6790049 $`2` [1] 0.4547805 $`3` [1] 0.8085015 > head(airquality) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 5 6 7 8 9 31 30 31 31 30 > lapply(s,function(x) colMeans(x[,c("Ozone","Wind","Temp")])) $`5
#作图分三类 1.基础包base 略显陈旧 了解一下 plot(iris[,1],iris[,3],col = iris[,5]) text(6.5,4, labels = 'hello') dev.off data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Petal.Length), size = 5, Petal.Length, color = Species))+ scale_color_manual(values = c("#2874C5" ,"#e6b707","#f87669")) #paletteer-集成多个配色R包,两千多种选择 if(! color = Species))+ scale_color_paletteer_d("awtools::mpalette") #用别人R包里的配色
,PS:R语言中行列名字中不能有特殊字符; 2)row.names = 1”这个参数意思时不能把第一列作为行名;PS:R语言中行名不能重复,如果将有重复的A列设为行名,需要先不将row.name参数添加进来 Normalized_RPKM_LOG2_matrix.txt.gz", check.names = F, row.names = 1) 二、零散知识 1、Rdata是R语言特有的数据储存格式 用三种方法都蒙一次,然后安装;R语言的工作路径设置在C盘也没关系,因为R包占用的空间不多。 limma") install.packages('devtools') devtools::install_github("jmzeng1314/idmap1") #括号里写作者用户名加包名 2、在R语言中 4、本地安装,将R包zip文件下载下来,然后放在工作路径中 devtools::install_local(“xxxx.zip”) 5、window电脑可能会存在的权限问题 6、R包不会用,有作者的第一手教程
#因子:分类数据 #有序和无序 #整数向量+标签label #Male/Female #常用于lm(),glm()
一.向量> x <- seq(1,20) #向量> print(x) [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20> print (x[-4]) [1] 1 2 3 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20> print(x[x %in% c(1,2,5)])#存在于向量 c(1,2,5)中的元素[1] 1 2 5二.数据框以mtcars为例read.table(file='mtcars.txt',sep='\t',header = T)m <- mtcarscolnames (m)[2] #查看第二列列名m$gear #最常用 [1] 4 4 4 3 3 3 3 4 4 4 4 3 3 3 3 3 3 4 4 4 3 3 3 3 3 4 5 5 5 5 5 4
Day5:R语言数据结构基本概念赋值符号:<- 和 = 。Console控制台:输入命令相当于Linux命令行。代码规范:代码使用英文括号。工作路径:使用 getwd() 查看。 根据自己的情况来修改 x[4] #x第4个元素 x[-4]#排除法,除了第4个元素之外剩余的元素 x[2:4]#第2到4个元素 x[-(2:4)]#除了第2-4个元素 x[c(1,5) ] #第1个和第5个元素 根据值 - x[x==10]#等于10的元素 x[x<0] x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素 数据框(Data Frame)示例数据获取
R语言meta分析(1)meta包 R语言meta分析(2)单个率的Meta分析 R语言meta分析(3)亚组分析 R语言meta分析(4)网状Meta 分析 R语言meta分析(5)累积Meta分析
新手须知(1)R的规范赋值符号是<-,也可以用=代替(2)在Console 控制台输入命令,相当于Linux的命令行 (3)R的代码都是带括号的,括号必须是英文的。 (4)显示工作路径 getwd()(5)向量是由元素组成的,元素可以是数字或者字符串。(6)表格在R语言中称为数据框(7)使用?函数或命令命令查看某个函数或命令的意义,如? 重复2次从变量中提取元素: x[4] x的第4个元素 x[-4] 除了第4个元素之外剩余的元素 x[2:4] 第2到4个元素 x[-(2:4)] 除了第2-4个元素 x[c(1,5) ] 第1个和第5个元素 x[x==10] 等于10的元素 x[x<0] 小于0的元素 x[x %in% c(1,2,5)] 存在于向量c(1,2,5)中的元素数据框setwd("C:\\Users
title: "day5note"output: html_documentdate: "2024-03-11"csv格式可用excel、记事本、sublime、R打开r语言读取 读入r语言得到一个数据框 ,对数据框的修改不会对该表修改分隔符号 :逗号 空格 制表符(\t)纯文本文件后缀没有意义,不起决定性作用1.表格文件读入r语言,成为数据框1.1直接读取read.table() #通常读取txt格式read.csv class括号里面是变量## [1] "data.frame"2.将数据框导出#csv格式write.csv(test,file = "example.csv")#txt格式write.table()3.R特有的数据保存格式 :Rdata#只能用R打开#保存的是变量save(test,file="")4.文件读写4.1读取ex1.txtex1 <- read.table("ex1.txt")ex1 <- read.table read.csv("ex2.csv")ex2 <- read.csv("ex2.csv",row.names = 1,check.names = F) #第一列设置为行名 #不要检查文件列名的特殊字符5.
plot(iris[,1],iris[,3],col=iris[,5])text(6.5,4, labels = 'hello')library(ggpubr)p = ggboxplot(iris, x stat_compare_means(comparisons = my_comparisons, aes(label = after_stat(p.signif)))1 R语言画图 1.1 常用可视化R包和函数作图:base, ggplot2, ggpubr拼图:par里的mfrow, grid.arrange, cowplot, patchwork导出:经典三段论、ggsave、 1.2 基础包(base)-绘图函数高级/低级绘图函数 #高级绘图函数可独立于其它函数,低级绘图函数:用于在图中添加元素高级绘图函数:低级绘图函数:plot(iris,1,iris,3,col=iris,5) #点的大小5mm alpha = 0.5, #透明度为50 % shape = 8) #点的形状映射:按照数据框的某一列定义某个属性
c(1,3,5,7);c("toufa","jiemao","yanjing") 2、赋值 即 赋予这个变量一个数值、字符串/数据框等。 3、从向量中提取元素 根据元素的位置 x<- seq(3,50,2) x[3] x[-5] x[3:10] x[-(3:10)] x[c(6,16)] ... kaishi.RData") #保存当前所有变量 save(X,file="kaishi.RData") #保存其中一个变量 load("kaishi.RData") #再次使用RData时的加载命令 ... 5、 提取元素 x=read.table() x[2,5] #坐标点 x[3,] x[,5] #第5列= x[5] x[3:5] #第三列到第五列 x[c(3,5)] #第三列和第五列 X$fenlei
purrr替代循环 1 purrr循环 引用知乎张敬信的说法: ❝用 R 写 「循环」 从低到高有三种境界:手动 for 循环,apply 函数族,purrr 包泛函式编程。 ❞ R写循环有三个境界: 手动for循环 apply循环 purrr泛函式编程 其中,手动for循环我最常用,apply系列半吊子,purrr函数一窍不通,所以要学习一下。 y2 1 0.5817177 10.355036 2 1.4852696 10.058380 3 1.0901313 11.682624 4 0.2128081 11.119148 5 pmap_chr等,返回字符 *_lgl,返回逻辑型向量 *_dbl,返回实数型向量 *_int,返回数字型向量 *_df,返回数据库 *_dfr, 返回数据库行合并 *_dfc, 返回数据框列合并 5 x1 [1] -0.1100182 $x2 [1] -0.2338953 $x3 [1] -0.3660053 $x4 [1] 0.02137338 7 map的用法1:批量建模 这里使用我的R包
Beijing","Shanghai")向量中提取元素x[4] #x第4个元素x[-4] #除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素x[x==10]x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素数据框read.table(file="names",sep="\t",header
是时候 关注 我们一波了 经过前面几次推文的学习,相信大家对R语言已经有了一个大概的了解,同时也初步感受了R语言在数据处理领域的强大功能,不过实话实说,前面的内容还只是R语言应用的冰山一角而已。 从这次推文开始,我们就要正式开始接触R语言对数据处理的强大能力。 同时我们也跟大家讲一下R里面的常用运算符:加(+)、减(-)、乘(*)、除(/)、求幂(^或者**)、求余(%%)、整数除法(%/%,如5%/%2=2)。 ? 图5:变量重命名的方法。 *plyr包是一个集合了很多数据集操作函数的R包,大家可以查看其帮助文档进一步学习。 ? 5.数据的排序 数据的排序在R语言中可以说比在Excel中还要简单了,简单给大家展示一下函数order()的用法。
zip发到自己电脑,解压放进去文件的读取csv的打开方式:默认exceltextsublime R语言读取(在r语言里对数据框的修改不会影响原数据)读取 数据框read.csv("") 读取csv read.table 里面需要指定一些参数如果想知道读取后是什么数据结构,用class(变量名),不能输入文件名csv,不然是字符串,变量名一半不带“”,有“”的就是字符串数据框导出为表格文件csv格式txt格式Rdata是R语言特有的数据储存格式 所以更改一下代码,加上header = T列名就不被计为第一行了row.namescheck.name第一列其实是行名字,但在读取的时候,她自己加了一个x作为列名给第一列定义为了数据列名里如果有特殊字符有时候也会被r语言自己检查 mean.default(y[, 1]) : argument is not numeric or logical: returning NA > y[,1]GSM1 GSM2 GSM3 GSM4 GSM5 "QSeq ID" "Strand" "Source Seq Length" "/qseq_name"[5]