> is.na(x) [1] FALSE TRUE FALSE TRUE FALSE
Day6. 1.5 ggplot2基础语法ggplot(data = <DATA>)+ <GEOM_FUNCTION>( mapping = aes(<MAPPINGS>), position = <POSITION 1.9 拼图R包patchwork:堪比R语言领域的“美图羞羞”语法简单,兼容ggplot2拼图比例设置简单,具体见下图和下图二维码。1.10 练习? 该笔记工作目录下基础包画图500行代码zz_basic plot ... .Rggplot2画图50个案例:top50ggplot.html小洁老师语雀的画图合集如何控制横坐标、纵坐标顺序?? <- str_remove_all(x5," rep3")x6x7 <- str_replace(x6,"C","c")x8 <- str_replace(x7,"V","v")x8load("test1
虽然有object的概念,但是R本身仍然是一种自顶向下式的编程方式,大部分功能都是通过各式各样的函数来实现的。 输入输出调节 将写好的R脚本运行会在命令行中调用source()函数运行脚本,并将结果输出到命令行中。 数据结构 R中的数据结构有很多种类型,不同的数据结构存储不同的数据,标注以及索引的方式也会有所不同。 refer R的索引也支持python中":"的操作,不过需要注意的是r中的索引初始位置从1开始,对于vectors,共有三种索引方式: a <-c("xiaoming","xiaohong","xa" R的matrix是有行列标签的,可通过dimnames传入。
R语言基础 R语言是用函数处理数据 1、R与Rstudio 2、数据类型 3、数据结构 4、函数和R包 5、文件读写 6、绘图(一个应用的方向) 7、应用专题 一、R语言 入门认知 1.R语言与RStudio 1.1 什么是R 是什么:编程语言,软件,环境 作用:数据处理,统计,可视化 优点:开源,可扩展(R包,安装到电脑上使用这些R包),简单有效 1.2 什么是R Studio(让R语言变得更好用的软件 例如 >a=3+5 > #运行完出现大于号,表示已运行完成 5、太长时间卡住不懂 中止(点击红色键)或重启 6、出现“+“ 命令不完整,补全或按ESC键退出 7、出现提示信息 检查是否有 2 向量的生成 2.1 向量的生成(向量是一串同一种数据类型组合成的整体) 有4种办法 (1)用c()逐一放到一起 【 虽然只有一个字母,但是这也是个函数c】 >c(2,5,6,2,9) >c(" rnorm 【随机数函数可以用来编数据练习】 >rep("x",times=3) #输出的结果是 "x""x""x" >seq(from=3,to=21,by=3) #输出的结果是:3,6,9,12,15,18,21
arrange(Sepal.Length) %>% head(,3) 输出结果: 图片 图片 #模拟一个表达矩阵数据 set.seed(1) exp = matrix(rnorm(18),ncol = 6) exp = round(exp,2) rownames(exp) = paste0("gene",1:3) colnames(exp) = paste0("test",1:6) exp[,1:3] =
今天继续学习R语言基础的R包使用,以R包:dplyr为例 数据准备 01 R包的安装 install.packages(“dplyr”) 或BiocManager::install(“dplyr”) /s/XvKb5FjAGM6gYsxTw3tcWw 03 R包及数据准备 install.packages("dplyr") library(dplyr) test <- iris[c(1:2,51:52,101 这里的“,”怎么理解呢,在我们上一期推文中提到,提取元素时z[x,y]指代提取z中第x行,第y列,如果我们只需要提取行,则应该写作z[x,],同理,如果只需要提取列,应该写作z[,y] dplyr五个基础函数 tidyverse是一个汇总包,一包更比6包强,用于数据清洗、转换、可视化等。 经过这几期的R语言基础,你应该能够入门R了,渐渐的也要自己去学会看帮助文档,去搜报错,还记得怎么搜命令和R包的帮助文档吗? ?
RStudio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。 01 安装R 进入R的官网https://www.r-project.org/ 第一步 点击红框中的download R 第二步 在镜像这里中选择第一个 第三步 接下来按照红框点点点就能完成R的安装 list.files() #同上 示例 2.加减乘除 和其他编程语言相同,直接输入即可 示例 3.赋值 赋值符号 <- 或 ALT - x <- 2+3 #将2+3的结果赋值给x y <- 5/6 #将5/6的结果赋值给y 赋值结束后即可在右上角environment栏中看到现在赋值过的变量 4.删除变量 x <- 2+3 #将2+3的结果赋值给x y <- 5/6 #将5/6的结果赋值给y rm(x,y) #删除x和y变量 rm(list = ls()) #清空所有变量 5.列出历史命令 history() #列出所有使用过的命令 或直接点击右上角History一栏中查看 6.清空控制台
R基础|do包(3):宽型数据转长型数据reshape_toLong(1) R基础|do包(4):宽型数据转长型数据reshape_toLong(2)进阶 R基础|do包(5):宽型数据转长型数据reshape_toLong df = data.frame( id=c(1,1,1,2,2,2), 年龄=c(1,3,2,2,1,3), 身高=c(1,3,2,3,2,4), 体重=c(4,6,5,6,5,7 do包中的其他命令 R基础|do包(1):左截取、右截取、中间截取 R基础|do包(2):替换replace R基础|do包(3):宽型数据转长型数据reshape_toLong(1) R基础| do包(4):宽型数据转长型数据reshape_toLong(2)进阶 R基础|do包(5):宽型数据转长型数据reshape_toLong(3)直升机 课程目录 1、简介 2、安装R语言及Rstudio 软件 3、安装nsfc包 4、abstract命令:批量查询(含摘要) 5、search命令:让查询--随心所欲 6、总结
3.1 数据框来源 (1)用代码新建 (2)由已有数据转换或处理得到 (3)读取表格文件 (4)R语言内置数据 3.2 新建数据框(数据框是以列为单位组织的) 3.2.1 用代码新建 data.frame change = rep(c("up","down"),each = 2), score = c(5,3,-2,-4)) 可以R中跑一次上面的代码看看 >df1$p.value<- c(0.01,0.02,0.07,0.05) #这个列的名字之前的里面没有 >df1 #行名和列名的修改,也就是向量的修改 >rownames(df1)<- c("r1 ","r2","r3","r4") #修改全部行名 > colnames(df1)[2] <-"CHANGE" #改一个列名,比如修改第二列的列名,就是修改【列明这个向量】的第二个元素
比较运算的结果是逻辑值 < , > , >= ,<= , ==, !=
3.在“管理本地用户和组”中找到当前用户的用户名,就可以看到用户名是英文还是中文了下载R和Rstudiob站有教程,暂时不需要装R包什么是RR是一种编程语言,也可以统计计算、绘图,它汇集了很多函数RStudio 是免费提供的开源集成开发环境(IDE),RStudio提供了一个具有很多功能的环境,使R更容易使用,方便用户在终端中使用R页面如下各窗口的功能如下:1.控制台(左下窗口)脚本运行和结果展示2.脚本编辑器 (左上窗口)在处理数据时,通常会编写一份脚本文件,即一组命令的集合来表示整个操作过程的逻辑流,该脚本文件可以直接读取并由R引擎执行。 6.绘图窗口(plots)(右下窗口)用来展示R代码生成的图形。7.扩展包窗口(packages)(右下窗口)展示所有安装过的拓展包。 <- 赋值符号,小于号加上减号,也可以按Alt加上减号实操运行x<-56+89x1 145y<-43*16y1 688删除变量:代码依然是rm()实操运行a<-3b <- 1c <- 4u <- 5+6rm
1.设置字体大小 tools→Global Options→Appearence→Editor font size 2.R语言基本操作 2.1用Rproject管理工作目录 每项工作任务要单独新建一个project
R的使用 在Rstudioy中新建项目(R project) File-New Project-New Directory-New Project-Directory name-Creat shift+F10) 工作目录(working directory)默认在 .Rproject文件夹下 打开文件时,双击打开 .Rproject 即可打开RStudio,打开后工作目录自动设置好了 R界面文字放大 “control” + “shift” + “+” R界面文字缩小 “control” + “-” 二.报错 报错: Error 。 x==y #比较运算 1 FALSE FALSE TRUE FALSE x\*y #计算 1 3 6 25 6 paste(x,y,sep = "/") 1 "1/3" "3/2" "5/ 5" "1/6" 两个向量(长度不一致)的操作 x <- c(1,3,5,1,6) y <- c(3,2,5) x==y #长度不一致,发生循环补齐 Warning: longer object length
"mylife") #保存工作空间到mylife文件中 load("mylife") #载入工作空间 #输入与输出 #重定向至文本文件和图像文件 source("inputFile.R" class mode names c(obj1,obj2) cbind(obj1,obj2) rbind(obj1,obj2) head tail ls() rm(obj1,obj2) #批处理 R CMD BATCH options infile outfile #linux "c:\program\r\r.exe" CMD BATCH --vanilla --slave "c:\myscript.R font.axis=3) plot(dose, drugA, type=”b”, pch=19, lty=2, col=”red”) plot(dose, drugB, type=”b”, pch=23, lty=6, col=”blue”, bg=”green”) par(opar) par(mfrow=c(1,1)) #R函数定义与实现 #R函数调用 sum.of.squares <- function(x,y
R基础概念及数据类型重要提示1.Tab键可以补全函数、变量名、指定数据框的行名列名等,能够有效避免错误输入与提高效率2.只有赋值才会使变量发生变化,没有赋值R只是单纯展示出数据3.在R中,Error是唯一代表错误的 ,大部分Warning可以忽略,但并不是出现了Error才是错误,一定要反复检查代码是否完成了目的,小心暗流4.R中“=”与“<-”均可表示赋值,但是在函数的形式参数=实际参数中,仅可用"="<em>R</em>中数据类型分为字符 is.numeric(a)> a<-1> class(a)[1] "numeric"> a<-as.character(a) #仅当赋值了a才会改变> is.numeric(a)[1] FALSE向量向量将R中不同元素组合生成 表示生成包含数字1-5的向量 (2) seq函数指定起点、终点与步长 (3) rep函数重复某一字符或数字 (4) paste及paste0实现字符的连接 (5) 通过判断生成逻辑型向量 (6)
前言: 在前面介绍了R的基础入门语法之后,现也将最近整理好的一些R的基础绘图实例提供给需要的朋友参考。(温馨提示:代码慎用!按照本博文实例进行练习的话最好能做到举一反三。 #基础R绘图 x <- 1:100 y <- 100 + x*5 windows(300,200);plot(y) #默认情况绘制散点图type="p" windows(300,200);plot lines(density(x4),col="blue") box() #加方框 #茎叶图,条形图 x5 <- rnorm(100,5,2) stem(x5) barplot(x5) box() x6 <- 1:5;pie(x6,col=rainbow(5)) box() #绘制箱线图 x7 <-rnorm(10,10,3);boxplot(x7) data(iris) sunflowerplot (1:10) rect(1,5,4,8,col="blue") dev.off() dir() #查看"myplot.jpeg" #end------------------ 结语: R作为一款越来越受追捧的数据分析工具
1安装包 问题: 如何安装R包? 方法: 使用install.packages()函数来安装包,括号中写上要安装的包的包名。 去除第一列,指定之后3列的类型 data <- read_excel("datafile.xlsx", col_types = c("blank", "text", "date" ,"numeric") 6管道操作符
一、R 语言简介 1.1 R 语言历史 R 语言是一款统计软件,R 语言也是一门编程语言,R 语言也是一个数据分析平台。 该项目始于 1993 年,2000 年发布了首个官方版本 R 1.0.0 ,后期维护由 R 核心团队(R Core Team)负责。截止 2019 年 4 月,已发布到 3.6 版本。 ,基因组圈图等复杂图形; 6、R 语言的 Bioconductor 项目可以处理生物数据,例如基因表达数据,单细胞测序等; 7、R 语言学习成本较大,不如 Excel 简单。 3、R 语言的绘图能力更强,尤其是 ggplot2 包; 4、python 兼容性不好; 5、python 具有更强大的文本处理能力; 6、python R 语言更擅长处理结构化数据,因此,在使用 R 之前,尽量确保数据是严格的表格结构。也就是二位的表格,分为行和列。在 R 语言中,行称为“观测”,列称为“变量”。
安装和加载R包1.镜像设置2.安装R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)3.加载library和require,两个函数均可。 dplyr五个基础函数1.mutate(),新增列2.select(),按列筛选3.filter()筛选行4.arrange(),按某1列或某几列对整个表格进行排序5.summarise():汇总dplyr inner_join,取交集2.左连left_join3.全连full_join4.半连接:返回能够与y表匹配的x表所有记录semi_join5.反连接:返回无法与y表匹配的x表的所记录anti_join6.
1.2 向量及后续 使用已准备好的Rproject(钉钉群里的R_01文件) 脚本打开是乱码的解决方式 2 向量 2.1 向量的生成(向量是一串同一种数据类型组合成的整体) 有4种办法 (1)用c 这个非常重要,需要记住】 >x=c(1,3,5,1) >table(x) 【 #重复值统计】 >x=c(1,3,5,1) >sort(x) 【#排序,R语言按照自己的想法排,那么怎么看R语言自己的想法呢 >a=seq(from=2,to=15,by=2) >paste0(rep("student",times=length(a)),seq(from=2,to=15,by=2) ) R语言里函数思想:能用函数代替 重点:%in%(没有快捷键) >x=c(1,3,5,1) >y=c(3,2,5,6) >x%in%y #x的每个元素在y中存在吗? >x == 8:12 >x[4] == 40 #改一个元素 >x >x[c(1,5)] == c(80,20) #改多个元素 R语言里的修改,都要赋值,没有赋值就没有发生过 2.6 简单的向量作图