半连接:返回能够与y表匹配的x表所有记录semi_joinsemi_join(x = test1, y = test2, by = 'x')5.反连接:返回无法与y表匹配的x表的所记录anti_join6. 简单连接:bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数生信星球
(library() : library(package)将加载名为package的命名空间,并添加到包的搜索列表中。加载前对搜索列表进行检查并更新,如果package不存在则报错,如果之前已加载package,则不会重复加载。如没有参数package即library(),则列出lib.loc指定的库中的所有可用包。library(help=package)将返回package的基本信息。
R包是多个函数的集合,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。 ",'D'))test1test2 <- data.frame(x = c('a','b','c','d','e','f'), y = c(1,2,3,4,5,6) test1, y = test2, by = 'x') 5.反连接:返回无法与y表匹配的x表的所记录anti_joinanti_join(x = test2, y = test1, by = 'x') 6. 函数则需要两个数据框有相同的行数test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40))test1test2 <- data.frame(x = c(5,6)
DAY5 本篇内容引自生信技能树 六、R语言作图 1、作图分三类 #作图分三类 #1.基础包 略显陈旧 了解一下 plot(iris[,1],iris[,3],col = iris[,5]) text (2)属性设置 练习6-1 # 时间有限,先在现有的代码基础上修改,课后再自己敲 # 6-1 # 1.加载test.Rdata,分别test的以a和b列作为横纵坐标,change列映射颜色,画点图。 position='jitter')#全局设置 (4)位置调整 #geom_point(position = "jitter") geom_jitter() (5)坐标系 coord_flip() (6) 5、画图扩展部分 (1)STHDA网站 (2)工作目录里有扩展学习的代码 (3)小洁老师语雀画图合集 DAY6 七、R语言的综合运用 引自生信技能树 1、玩转字符串 引自生信技能树 rm(list = #匹配 (2)order() #用的少,用arrange (3)dir() #和文件打交道 (4)file.creat() #和文件打交道 (5)file.exists() #和文件打交道 (6)
今日学习内容:了解conda下载和安装miniconda下载个软件看看---condaconda是linux的软件商店minconda包含了Python和conda,可用于生信使用装载miniconda
的平均值和标准差dplyr两个实用技能1:管道操作%in%(ctr+shift+m),一步实现三步操作,简便2:count()#统计某列的重复值unique报错原因,没有区分大小写#dplyr处理关系数据6: 简单合并思维导图生信星球
x'), z = c("A","B","C",'D')) test2 <- data.frame(x = c('a','b','c','d','e','f'), y = c(1,2,3,4,5,6) test1, y = test2, by = 'x') 5.反连接:返回无法与y表匹配的x表的所记录anti_join anti_join(x = test2, y = test1, by = 'x') 6. c(10,20,30,40)) test1 ## x y ## 1 1 10 ## 2 2 20 ## 3 3 30 ## 4 4 40 test2 <- data.frame(x = c(5,6) , y = c(50,60)) test2 ## x y ## 1 5 50 ## 2 6 60 test3 <- data.frame(z = c(100,200,300,400)) test3
Day6-i 生信星球学习安装&加载R包&使用镜像设置options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))清华源
R语言有丰富的图表和Biocductor上面的各种生信分析R包。 D')) test1 test2 <- data.frame(x = c('a','b','c','d','e','f'), y = c(1,2,3,4,5,6) = test2, by = 'x') ## 5.反连接:返回无法与y表匹配的x表的所记录anti_join anti_join(x = test2, y = test1, by = 'x') ## 6. 函数则需要两个数据框有相同的行数 test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40)) test1 test2 <- data.frame(x = c(5,6)
的特殊语法:列名不带引号,画同一个图片的两个函数之间用“+”连接1.属性设置(颜色、大小、透明度、点的形状,线型等)方法1:手动设置,注意需要把实际参数设置为有意义的值颜色:代表颜色的字符串如“#F8E6FF shape=Species,color=Species))+ coord_flip()+ theme_bw()+ scale_fill_manual(values = c('#C4B4F5','#F8E6FF
返回能够与y表匹配的x表所有记录semi_join图片5.反连接:返回无法与y表匹配的x表的所记录anti_joinanti_join(x = test2, y = test1, by = 'x')图片6.
(6)表格在R语言中改名叫数据框^_^ (7)别只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:? (8)数据类型(重点只有两个,剩下的不看) --生信星球 part1:向量 元素包括:数字或者字符串(用chr表示)等 标量:一个元素组成的变量 向量:多个元素组成的变量 图片 赋值 x<- c(1,2,3 - X[a:b]#第a列到第b列 - X[c(a,b)]#第a列和第b列 - X$列名#也可以提取列(优秀写法,而且这个命令还优秀到不用写括号的地步,并且支持Tab自动补全哦,不过只能提取一列) (6)
其实我现在已经不写软件教程了! 1e-5 -num_descriptions 10 -num_threads 8 blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 1e-5 -num_descriptions 10 -num_threads 8 blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -num_threads 8 参数说明: -query: 输入文件路径及文件名 -out:输出文件路径及文件名 -db:格式化了的数据库路径及数据库名 -outfmt:输出文件格式,总共有12种格式,6是 可以看到大多reads都是100bp长度,很整齐 6,可能的重复序列表格 ? 可以看到这些重复序列比例很高,高达千分之一,而且被注释了可能的来源,adapter,是需要去除的。
Day6-学习R包生信星球小组学习-LuKaR包的安装主要有四种方法,包括:1)从R语言官网上直接下载相关R包并安装;2)从Bioconductor上下载R包并安装;3)从Github上下载R包并安装;
alpha = 0.5, # 透明度 50% shape = 6,
首先用file.edit()来编辑文件:file.edit('~/.Rprofile')
生信星球学习小组笔记 2023年12月2日一、R包的下载与装载设置镜像(解决因网络问题不能下载)options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn package")即可二、R包的使用方法(以dplyr包为例)*示例数据test <- iris[c(1:2,51:52,101:102),]> head(test) #head()函数观察下数据的前6行 2.7 5.1 1.9 virginica5 5.1 3.5 1.4 0.2 setosa6
豆花寄语:学生信,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。 6.处理数据关系 1.test1 <- data.frame(x = c('b','e','f','x'), z = c("A","B","C",'D')) test2 <- data.frame(x = c('a','b','c','d','e','f'), y = c(1,2,3,4,5,6)) data.frame(): 这个函数用来创建数据框。 6.反连接:返回无法与y表匹配的x表的所记录`anti_join anti_join(x = test2, y = test1, by = 'x'),针对test1和test2,就是acd 这个操作的目的是从 7.简单合并 test1 <- data.frame(x = c(1,2,3,4), y = c(10,20,30,40)) test2 <- data.frame(x = c(5,6), y = c(
Class 6#本文引用自生信技能树【知识拓展】【1.当不确定自己输入的代码是否正确时,可以用attach()括号内填入你想使用的数据,这样当你想用a数据里面的某列名字时,可以直接用Tab打出他的名字并且不会出错如图片 y = Petal.Length, color = Species), shape = 24, fill = "black") 图片6.