title: "note2"
output: html_document
date: "2023-05-10"
R Markdown向量
#脚本与ppt对应
#运行脚本:光标放在某一行,点”run”,快捷键ctrl+enter(mac:command+enter)
#向量的生成,对单个/两个向量进行的操作,取子集,元素修改。
#1.三种类型,格式大于内容,“4”代表字符,&:shift+7;|:shfit+enter上面的键,!:shift+1,赋值:alt-,<-,注意(-2),要么加括号,要么空一格,等于==,!=
#2.判断函数is.number(),T,F,NA(缺失值),转换as.number(),转换优先顺序 表格的行名和列名不属于表格内容,因此是4列
#注释1在R语言中,as.complex和as.numeric函数都可以用于将数据转换为复数类型或数字类型。但是,它们的主要区别在于:as.complex函数只能将字符串或数值向量转换为复数类型,而as.numeric函数可以将任何数据类型(如字符型、逻辑型等)转换为数字类型。当传入的参数无法转换为所需的类型时,as.complex函数会返回NA(缺失值),而as.numeric函数则会报错。对于复数类型,as.complex函数可以将字符串表示的实部和虚部分离开,并分别转换为相应的数值;而as.numeric函数只能将单个数值转换为数字类型。因此,当需要将字符串表示的复数转换为复数类型时,应使用as.complex函数;而对于其他类型的数据,应使用as.numeric函数。
#3
#####2.1.向量生成?#####
#(1)用 c() 结合到一起,数据类型转换的优先顺序,为什么转换,因为只会输出一种数据类型
c(2,5,6,2,9) ## [1] 2 5 6 2 9c("a",4)## [1] "a" "4"c(4,TRUE)## [1] 4 1#(2)连续的数字用冒号“:”
1:5## [1] 1 2 3 4 5#(3)有重复的用rep(),有规律的序列用seq(),随机数用rnorm()
rep(c("a","b"), 3) ## [1] "a" "b" "a" "b" "a" "b"rep(c("a","b"),each=3)## [1] "a" "a" "a" "b" "b" "b"seq(from = 3,to = 21,by = 3)## [1] 3 6 9 12 15 18 21rnorm(n = 3)## [1] -0.8559376 0.2752149 -0.8164835#(4)通过组合,产生更为复杂的向量.循环补齐(向量长度不相等+等位运算),简化代码。
paste0(rep("x"),1:3)## [1] "x1" "x2" "x3"#####2.2对单个向量进行的操作####
#(1)赋值给一个变量名
x = c(1,3,5,1) #随意的写法
x## [1] 1 3 5 1x <- c(1,3,5,1) #规范的赋值符号 Alt+减号
x#输出## [1] 1 3 5 1#赋值+输出一起实现,分隔号;
x <- c(1,3,5,1);x## [1] 1 3 5 1(x <- c(1,3,5,1))## [1] 1 3 5 1#(2)简单数学计算
x+1## [1] 2 4 6 2log(x)## [1] 0.000000 1.098612 1.609438 0.000000sqrt(x)## [1] 1.000000 1.732051 2.236068 1.000000#(3)根据某条件进行判断,生成逻辑型向量
x>3## [1] FALSE FALSE TRUE FALSEx==3## [1] FALSE TRUE FALSE FALSE#(4)初级统计
max(x) #最大值## [1] 5min(x) #最小值## [1] 1mean(x) #均值## [1] 2.5median(x) #中位数## [1] 2var(x) #方差## [1] 3.666667sd(x) #标准差## [1] 1.914854sum(x) #总和## [1] 10length(x) #长度,7怎么得到?## [1] 4unique(x) #去重复,第一次出现视为没有重复## [1] 1 3 5duplicated(x) #对应元素是否重复## [1] FALSE FALSE FALSE TRUEtable(x) #重复值统计## x
## 1 3 5
## 2 1 1sort(x)## [1] 1 1 3 5sort(x,decreasing = F)## [1] 1 1 3 5sort(x,decreasing = T)## [1] 5 3 1 1#####2.3.对两个向量进行的操作#####
x = c(1,3,5,1)
y = c(3,2,5,6,4)
#(1)比较运算,生成等长的逻辑向量:循环补齐
x == y ## [1] FALSE FALSE TRUE FALSE FALSEy == x## [1] FALSE FALSE TRUE FALSE FALSE#(2)数学计算
x + y## [1] 4 5 10 7 5#(3)连接
paste(x,y,sep=",")## [1] "1,3" "3,2" "5,5" "1,6" "1,4"#paste与paste0的区别
paste(x,y)## [1] "1 3" "3 2" "5 5" "1 6" "1 4"paste0(x,y)## [1] "13" "32" "55" "16" "14"paste(x,y,sep = "")## [1] "13" "32" "55" "16" "14"paste(x,y,sep = ",")## [1] "1,3" "3,2" "5,5" "1,6" "1,4"#注释2在R语言中,paste和paste0都是用于连接(concatenate)字符串的函数。它们的区别如下:paste()函数:将多个输入对象连接成一个字符串,并在每两个相邻的对象之间添加分隔符,默认为一个空格。例如,paste("a", "b", "c")返回值为 "a b c"。paste0()函数:与paste()函数类似,但是不会在对象之间添加分隔符。例如,paste0("a", "b", "c")返回值为"abc"。因此,如果你需要在字符串之间添加分隔符,则使用paste()函数;如果你不需要添加分隔符,则使用paste0()函数可以使代码更简洁易读。这里还有一些其他的区别:paste函数可以接受多个参数,并将它们连接起来,而paste0只接受两个或多个参数。paste函数的默认分隔符是空格,但是你可以使用sep参数来指定自己想要的分隔符。而paste0没有分隔符参数,始终不添加分隔符。总之,paste()和paste0()函数的主要区别在于是否添加分隔符。
#当两个向量长度不一致,循环补齐(向量长度不相等+等位运算),简化代码。
x = c(1,3,5,6,2)
y = c(3,2,5)
x == y # 啊!warning!## [1] FALSE FALSE TRUE FALSE TRUE#循环补齐--看ppt
#利用循环补齐简化代码
paste0(rep("x",3),1:3)## [1] "x1" "x2" "x3"paste0("x",1:3)## [1] "x1" "x2" "x3"#(4)交集、并集、差集
intersect(x,y)## [1] 3 5 2union(x,y)## [1] 1 3 5 6 2setdiff(x,y)## [1] 1 6setdiff(y,x)## numeric(0)x %in% y #x的每个元素在y中存在吗,并不是运算,所以看问的元素有几个就输出几个## [1] FALSE TRUE TRUE FALSE TRUEy %in% x #y的每个元素在x中存在吗## [1] TRUE TRUE TRUE#注释3在R语言中,setdiff()函数用于求两个集合的差集(即除去两个集合中重复元素后仅出现在第一个集合中的元素集合),并返回结果。其基本语法格式如下:复制代码setdiff(x,y)其中,x和y是两个向量或集合,函数返回在x中出现而在 中没有出现的元素举个例子,在如下代码中:复制代码x <- c(1,2,3,4,5)y<-c(3,4,5,6)setdiff(x,y)函数将返回[1]12,因为在x中出现但在y中没有出现的数字有1和2需要注意的是,这里的集合是指向量,并且setdiff()函数只会保留中不重复的元素如果想保留所有元素,包括重复元素,则应使用 %in% 操作符或者 duplicated()函数
#####2.4.向量筛选(取子集)--看ppt#####
x <- 8:12
#根据逻辑值取子集,中括号里是逻辑值T/F
x[x == 10]## [1] 10x[x < 12]## [1] 8 9 10 11x[x %in% c(9,13)]## [1] 9#根据位置取子集,中括号里是数字或向量(3种,c/:/rep(),seq),rnorm()),所以x[1,5]会报错,因为中括号里啥也不是
x[4]## [1] 11x[2:4]## [1] 9 10 11x[c(1,5)]#c(1,5)代表位置1和5,而1,5啥也不是## [1] 8 12x[-4]#去掉第四个位置## [1] 8 9 10 12x[-(2:4)]#去掉234的位置## [1] 8 12####2.5.修改向量中的某个/某些元素:取子集+赋值
x## [1] 8 9 10 11 12#改一个元素
x[4] <- 40
x## [1] 8 9 10 40 12#改多个元素
x[c(1,5)] <- c(80,20)
x## [1] 80 9 10 40 20#### 2.6 简单向量作图
k1 = rnorm(12);k1## [1] -0.6812778 0.9673871 -1.4538542 -0.1372082
## [5] 0.3942805 0.5780699 2.2018450 -1.6925641
## [9] -0.9724937 -0.5663234 1.6842077 -2.3597461k2 = rep(c("a","b","c","d"),each = 3);k2## [1] "a" "a" "a" "b" "b" "b" "c" "c" "c" "d" "d"
## [12] "d"plot(k1)boxplot(k1~k2) #课后试着搜索boxplot表达什么意思引用生信技能书 This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.









原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。