> x2 <- Sys.Date() > class(x2) [1] "Date"
虽然有object的概念,但是R本身仍然是一种自顶向下式的编程方式,大部分功能都是通过各式各样的函数来实现的。 输入输出调节 将写好的R脚本运行会在命令行中调用source()函数运行脚本,并将结果输出到命令行中。 refer R的索引也支持python中":"的操作,不过需要注意的是r中的索引初始位置从1开始,对于vectors,共有三种索引方式: a <-c("xiaoming","xiaohong","xa" R的matrix是有行列标签的,可通过dimnames传入。 /data8.csv",header=T,sep=",") names(data) length(data) # class(data) mode(data)#存储方式为列表 dim(data) head
#调整角度,保存 pdf('3d_scatter_plot.pdf',onefile=TRUE,width=8,height=8) diffangle <- function(ang){ scatterplot3d
R语言基础 R语言是用函数处理数据 1、R与Rstudio 2、数据类型 3、数据结构 4、函数和R包 5、文件读写 6、绘图(一个应用的方向) 7、应用专题 一、R语言 入门认知 1.R语言与RStudio 1.1 什么是R 是什么:编程语言,软件,环境 作用:数据处理,统计,可视化 优点:开源,可扩展(R包,安装到电脑上使用这些R包),简单有效 1.2 什么是R Studio(让R语言变得更好用的软件 )R语言的命令提示符是 “>” 集成开发环境 图形界面(给简陋的R语言披上了好看的外衣) 开源免费 1.3 如何在R Studio中新建项目(管理工作目录的最佳方式,setwd也可以,但是这个更简单) #运行完出现大于号,表示已运行完成 5、太长时间卡住不懂 中止(点击红色键)或重启 6、出现“+“ 命令不完整,补全或按ESC键退出 7、出现提示信息 检查是否有error,没有就可以忽略 8、 ,那么怎么看R语言自己的想法呢?
今天继续学习R语言基础的R包使用,以R包:dplyr为例 数据准备 01 R包的安装 install.packages(“dplyr”) 或BiocManager::install(“dplyr”) 这里的“,”怎么理解呢,在我们上一期推文中提到,提取元素时z[x,y]指代提取z中第x行,第y列,如果我们只需要提取行,则应该写作z[x,],同理,如果只需要提取列,应该写作z[,y] dplyr五个基础函数 其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个. 我们这里用的是dplyr包,因此可以使用管道。 经过这几期的R语言基础,你应该能够入门R了,渐渐的也要自己去学会看帮助文档,去搜报错,还记得怎么搜命令和R包的帮助文档吗? ? +命令 #搜命令帮助文档 help(package='R包') #搜R包帮助文档 如果你能独立处理这些问题,那么恭喜你,你的R应该没问题啦! 应该没问题了!!!!吧?
学习生信时,最常用的可视化软件就是R,可大家在使用的时候又好像用的是Rstudio,究竟什么是R和Rstudio? R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。 RStudio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。 01 安装R 进入R的官网https://www.r-project.org/ 第一步 点击红框中的download R 第二步 在镜像这里中选择第一个 第三步 接下来按照红框点点点就能完成R的安装 第四步 第五步 R语言软件界面简陋,通常不直接使用,而是用图形界面的Rstudio。 参考资料:https://m.bilibili.com/video/av25643438.html R-project管理多个R工作目录
3.1 数据框来源 (1)用代码新建 (2)由已有数据转换或处理得到 (3)读取表格文件 (4)R语言内置数据 3.2 新建数据框(数据框是以列为单位组织的) 3.2.1 用代码新建 data.frame change = rep(c("up","down"),each = 2), score = c(5,3,-2,-4)) 可以R中跑一次上面的代码看看 >df1$p.value<- c(0.01,0.02,0.07,0.05) #这个列的名字之前的里面没有 >df1 #行名和列名的修改,也就是向量的修改 >rownames(df1)<- c("r1 ","r2","r3","r4") #修改全部行名 > colnames(df1)[2] <-"CHANGE" #改一个列名,比如修改第二列的列名,就是修改【列明这个向量】的第二个元素
比较运算的结果是逻辑值 < , > , >= ,<= , ==, !=
3.在“管理本地用户和组”中找到当前用户的用户名,就可以看到用户名是英文还是中文了下载R和Rstudiob站有教程,暂时不需要装R包什么是RR是一种编程语言,也可以统计计算、绘图,它汇集了很多函数RStudio 是免费提供的开源集成开发环境(IDE),RStudio提供了一个具有很多功能的环境,使R更容易使用,方便用户在终端中使用R页面如下各窗口的功能如下:1.控制台(左下窗口)脚本运行和结果展示2.脚本编辑器 (左上窗口)在处理数据时,通常会编写一份脚本文件,即一组命令的集合来表示整个操作过程的逻辑流,该脚本文件可以直接读取并由R引擎执行。 .Rproj" "生信.txt" 新建一个文档并删除“生信”文档后list.files()1 "runifpfg.png" "程.Rproj" "文档.txt" 加减乘除实操运行8+ 71 158^71 20971528*71 568/71 1.1428578-71 1sqrt(9)1 3abs(-4)1 4log2(256)1 8log10(100)1 2赋值<- 赋值符号,小于号加上减号
1.设置字体大小 tools→Global Options→Appearence→Editor font size 2.R语言基本操作 2.1用Rproject管理工作目录 每项工作任务要单独新建一个project
R的使用 在Rstudioy中新建项目(R project) File-New Project-New Directory-New Project-Directory name-Creat 文件中不要有中文和字符) 新建脚本 (Ctr+shift+N) 更改字号 (Tools-Global options-Apearance-Editor font size) 重启 session-restart R shift+F10) 工作目录(working directory)默认在 .Rproject文件夹下 打开文件时,双击打开 .Rproject 即可打开RStudio,打开后工作目录自动设置好了 R界面文字放大 “control” + “shift” + “+” R界面文字缩小 “control” + “-” 二.报错 报错: Error 。 15) [1] 8 9 10 11 12 13 14 15 x[4] <- 20 ;x [1] 8 9 10 20 12 13 14 15 x[c(5:6)] <- 3;x [1] 8 9
() #列出当前工作空间中的对象 rm(list=ls()) dir() #列出当前目录 dir.create(“c:/myproject”) options() #查看R软件默认选项的设置 "mylife") #保存工作空间到mylife文件中 load("mylife") #载入工作空间 #输入与输出 #重定向至文本文件和图像文件 source("inputFile.R" class mode names c(obj1,obj2) cbind(obj1,obj2) rbind(obj1,obj2) head tail ls() rm(obj1,obj2) #批处理 R CMD BATCH options infile outfile #linux "c:\program\r\r.exe" CMD BATCH --vanilla --slave "c:\myscript.R #R函数调用 sum.of.squares <- function(x,y) { x^2 + y^2 } sum.of.squares(3, 4)
R基础概念及数据类型重要提示1.Tab键可以补全函数、变量名、指定数据框的行名列名等,能够有效避免错误输入与提高效率2.只有赋值才会使变量发生变化,没有赋值R只是单纯展示出数据3.在R中,Error是唯一代表错误的 ,大部分Warning可以忽略,但并不是出现了Error才是错误,一定要反复检查代码是否完成了目的,小心暗流4.R中“=”与“<-”均可表示赋值,但是在函数的形式参数=实际参数中,仅可用"="<em>R</em>中数据类型分为字符 取出第4个元素x[2:4] #取出第2-4个元素x[c(1,5)] #取出第1、5个元素x[-4] #"-"代表去掉某一个元素,本例为去掉第4个元素x[-(2:4)] #去掉第2-4个元素> x <- 8: 12> #根据逻辑值取子集> x[x==10] #中括号内生成了c(F,F,T,F,F)的向量,取出了值为T的数据组成子集[1] 10> x[x<12][1] 8 9 10 11> x[x %in% 12> x[-4] #"-"代表去掉某一个元素,本例为去掉第4个元素[1] 8 9 10 12> x[-(2:4)] #去掉第2-4个元素[1] 8 12本文本根据生信技能树资料整理
前言: 在前面介绍了R的基础入门语法之后,现也将最近整理好的一些R的基础绘图实例提供给需要的朋友参考。(温馨提示:代码慎用!按照本博文实例进行练习的话最好能做到举一反三。 #基础R绘图 x <- 1:100 y <- 100 + x*5 windows(300,200);plot(y) #默认情况绘制散点图type="p" windows(300,200);plot polygon(c(15,10,30,40,45),c(-10,5,15,4,-10)) #savePlot()绘制图形保存方法一 windows() plot(1:10) rect(1,5,4,8, restoreConsole=T) dir() #查看"test01.jpg" #图形绘制保存方法二 jpeg(file="myplot.jpeg") plot(1:10) rect(1,5,4,8, col="blue") dev.off() dir() #查看"myplot.jpeg" #end------------------ 结语: R作为一款越来越受追捧的数据分析工具,以上简单作图函数只是它全部功能的冰山一角
1安装包 问题: 如何安装R包? 方法: 使用install.packages()函数来安装包,括号中写上要安装的包的包名。
一、R 语言简介 1.1 R 语言历史 R 语言是一款统计软件,R 语言也是一门编程语言,R 语言也是一个数据分析平台。 该项目始于 1993 年,2000 年发布了首个官方版本 R 1.0.0 ,后期维护由 R 核心团队(R Core Team)负责。截止 2019 年 4 月,已发布到 3.6 版本。 凭借其开源、免费、自由等开放式理念,R 迅速获得流行,目前已成为学术研究和商业应用领域最为常用的数据分析软件之一。随着大数据行业的发展,R 语言变得越来越流行,R 语言发挥了越来越重要的作用。 2.4 R 语言与 Python 对比 1、R 语言具有更强大的统计学功能; 2、R 语言的 Bioconductor 项目可以处理生物数据,例如基因表达数据,单细胞测序等; R 语言更擅长处理结构化数据,因此,在使用 R 之前,尽量确保数据是严格的表格结构。也就是二位的表格,分为行和列。在 R 语言中,行称为“观测”,列称为“变量”。
1.2 向量及后续 使用已准备好的Rproject(钉钉群里的R_01文件) 脚本打开是乱码的解决方式 2 向量 2.1 向量的生成(向量是一串同一种数据类型组合成的整体) 有4种办法 (1)用c 这个非常重要,需要记住】 >x=c(1,3,5,1) >table(x) 【 #重复值统计】 >x=c(1,3,5,1) >sort(x) 【#排序,R语言按照自己的想法排,那么怎么看R语言自己的想法呢 8:12 x<12 x[x<12] 2.4.2 取x向量中的对应下表的那些元素 (根据位置筛选) 比如 x<—— 8:12 x[4] #输出的结果是11 x[2:4 ] #输出的结果是9 10 11 x[c(1,5)] #输出的结果是8 12 取好几个就把他组成一个向量 x[-4] #反选的意思,只在数值中有意义。 >x == 8:12 >x[4] == 40 #改一个元素 >x >x[c(1,5)] == c(80,20) #改多个元素 R语言里的修改,都要赋值,没有赋值就没有发生过 2.6 简单的向量作图
FALSE TRUE y %in% x #y的每个元素在x中存在吗 1 TRUE TRUE TRUE #####2.4.向量筛选(取子集)--看ppt##### 筛选undefinedx <- 8: 12 #根据逻辑值取子集 xx==10 10 xx<12 8 9 10 11 xx %in% c(9,13) 9 #根据位置取子集 x4 11
8) file = ""时为手动输入数据。 > cat(1:10) 1 2 3 4 5 6 7 8 9 10 cat默认以空格分割,如果不想用,可通过sep参数自定义设置。 24 34 读写文件 1 从文件中读取数据库获矩阵 read.table()函数是R最基本函数之一,主要用来读取矩形表格数据。 (8)col.names 指定列名的向量。缺省情况下是又"V"加上列序构成,即V1,V2,V3...... 获取文件和目录信息 对于实现获取文件和目录信息,设置文件访问权限等功能,R有各种函数。以下是几个案例。
常用可视化R包和函数 1,作图 base ggplot2 ggpubr 2,拼图 par里的mfrow grid.arrange cowplot patchwork 3,导出 经典三段论 ggsave eoffice——topptx 绘图 图片 基础包 plot(iris[,1],iris[,3],col = iris[,5]) text(6.5,4, labels = 'hello') dev.off Petal.Length), size = 5, # 点的大小5mm alpha = 0.5, # 透明度 50% shape = 8) = my_comparisons)+ # Add pairwise comparisons p-value stat_compare_means(label.y = 9) 图片保存 图片 #1.基础包作图的保存 file_name x = x[colnames(y),] colnames(y) = x$ID # 2.一些搞文件的函数---- dir() # 列出工作目录下的文件 dir(pattern = ".R$