DAY5 本篇内容引自生信技能树 六、R语言作图 1、作图分三类 #作图分三类 #1.基础包 略显陈旧 了解一下 plot(iris[,1],iris[,3],col = iris[,5]) text iris, x="Sepal.Length", y="Petal.Length", color="Species") 2、ggplot2 (1)入门级绘图设置 color = change))+ scale_color_manual(values = c("darkgreen","grey","red")) library(ggplot2) #1.入门级绘图模板 5、画图扩展部分 (1)STHDA网站 (2)工作目录里有扩展学习的代码 (3)小洁老师语雀画图合集 DAY6 七、R语言的综合运用 引自生信技能树 1、玩转字符串 引自生信技能树 rm(list = ### 3.按位置提取字符串 str_sub(x,5,9) ### 4.字符检测 str_detect(x2,"h")#这串逻辑值的特点是:长度与向量x2一一对应,且长度相等。
)表示1-10之间每0.5取一个数从向量中提取元素x[4] #x第4个元素x[-4]#排除法,除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素x[x==10]#等于10的元素x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素数据框read.table(file="",sep="",header
class 5 #本文引用自生信技能树 一、判断R包的安装 1.电脑是否已经安装过此R包? >as.logical(require()) if(! [[]] · 而文件名称应该:1.在实际参数位置2.且在能识别文件名称的函数括号内3.带引号 5. 解决问题的正确姿势 (1)检查代码与环境 代码错误?环境问题?工作目录?重启? ,file="文件名") load()加载:load(“文件名”) (5)文件的后缀 没有意义,文件内容不改变 (6)文件导出 write.文件类型(变量,file=) (7)实站文件!! 列名是什么 dim(soft)---维度,统计多少行多少列 colnames(soft)-----列名 rownames()-----行名 5)将soft导出为csv write.csv(soft,file
R 语言与 C 语言都是贝尔实验室的研究成果,但两者有不同的侧重领域,R 语言是一种解释型的面向数学理论研究工作者的语言,而 C 语言是为计算机软件工程师设计的。
session(交互式会话),restartR将R重启(快捷键:ctrl+shift+F10),解决R90%的问题
这里的x是你刚才赋值的变量名,根据自己的情况来修改x[4] #x第4个元素x[-4]#排除法,除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素x[x==10]#等于10的元素x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素数据框(即常说的表格)(补充:一个向量是一排有序排列的元素,以后会用到把一个向量作为数据框中的一列的情况
下面是2022年4月_生信入门班_微信群答疑笔记 上一期答疑笔记是:2022年4月_生信入门班_微信群答疑笔记 整理人:汪哲 整理时间:2022年5月 联系方式:zhewang@webmail.hzau.edu.cn 本次开课时间:2022年4月25日——5月21日 课前答疑 运行完最后的library()那几行代码没有出现报错就是安装完毕对么? ID是数字没关系,能对应就好,它公司出产芯片自己的规定 我分组用治疗前、后样本,不管c3和c5,然后就有个报错,老师帮我看下 x里头是字符串,y里头是数值,所以没法inner_join。 () subread 安装后 command not found subread包含其它软件,但不包含一个叫subread的软件,比如你下了一个软件叫腾讯,它里面没有一个真的软件叫腾讯,他是腾讯的微信或者
今天的笔记是自己记的Goodnotes,字比较丑请见谅…………关于测序的入门,零基础的非常推荐【陈巍学基因】视频1,讲的很清晰,可以对二代测序有一个最基本的了解。
rnorm(n,mean,sd)函数用于从具有特定均值和标准差的正态分布生成n个随机值。
select筛选列、filter筛选行filter(test, Species == "setosa")filter(test, Species == "setosa"&Sepal.Length > 5 )filter(test, Species %in% c("setosa","versicolor"))分别表示:筛选species是setosa的列、species且sepal length大于5的列
生信星球数据结构 向量vector 标量:1个元素 向量:多个元素 从向量中提取元素 x[4] x[x==10] 位置、逻辑值 数据框 a <- read.table(file='huahua.txt'
seq(2,10,2),会生成一组数:2 4 6 8 10从向量中提取元素根据元素的位置提取 x[4]x中的第四个x[-4]x中除了第四个元素以外的所有元素x[2:4]x中的第2到4个元素x[c(1,5) ]x中第1和第5个元素根据值提取x[x==10]x中等于10的元素·xx%in%c(1,2,5)` x中存在于向量c(1,2,5)中的元素数据框读取本地数据文件一定要放在工作目录里read.table(
No.1 生物信息学 生物信息学(Bioinformatics),简称生信,是一门在人类全基因组测序工程和计算机工程基础上迅速发展起来的新兴交叉学科,目前主要定位于精准医疗,适用于复杂性状的基因定位 欢迎大家入门生信与临床,今后我将会和大家经常分享一些生信和临床知识!
测序原理测序是测生物体的遗传信息一代测序:sanger发明的70年代的双脱氧终止反应法原理如下:DNA的基本组成单位是单脱氧核苷酸(dNTP),dNTP5点位和3点位各有一个羟基。
mkdir (make directory 创建空目录)3. ls(显示列表 文件or目录都可)4. rm1)删除文件——rm2) 删除空目录--rmdir3) 删除非空目录--rm -rTIP:图片5.
我就是分享一些生信基础的生信分析技能,以满足大家在科研工作中的生信需求。说实话,大家需要给你自己以定位,自己做纯生信的还是只是借助生信为大家在湿实验中提供思路,或者文章中添加一些生信内容。 这里按照我个人的学习经历和总结,让刚刚入门的你,能快速学习一些基础的生信技能,学到高水平我也做不到,因为我自己也觉得自己很菜的,但有一些经验可以分享给大家。 1.首先给自己一个定位,你学生信为了干什么? 如果你不是纯生信的,比如做一些药理,分子生物学等相关以实验为主,那么你学习生信主要还是做一个辅助,你可能注重的还是一些基础分析。 5.数据可视化 这一点,我曾经写过一篇文章说过,可以参考阅读一下【我有必要花大量时间去学习R语言绘图吗??】 对于其他的书籍可以参考之前的文章:这才是生信入门的书籍清单。
长期更新列表: 视频讲解-R爬取生信软件列表到思维导图 生信技巧第二课-使用markdown记录和分享笔记 生信技巧第3课-请你务必学好R语言 broad官网出品的 必须神器 IGV 资料大全,含视频 不知不觉就第5讲了,本次视频没有干货,只是为了保证入门系列视频的完整性而录制的,没啥事就不用看了,反正你需要安装一些软件就可以了。 生信软件安装及使用 (官网,例子,conda) 多版本软件发布:NCBI的 blast以及sratoolkit 等等 二进制软件(预编译版本):下载即可使用 C源码软件:官网,readme,安装,解决配置文件及报错 系统软件中心:ubuntu的用apt-get,centos的用yum,macOS的App Store或者brew 成熟的软件管理中心:conda 保证一个纯粹的新手,生物学的本科生,经过3个小时的折腾
(4)显示工作路径 getwd()(5)向量是由元素组成的,元素可以是数字或者字符串。(6)表格在R语言中称为数据框^_^(7)别只复制代码,要理解其中的命令、函数的意思。 这里的x是你刚才赋值的变量名,根据自己的情况来修改x[4] #x第4个元素x[-4]#排除法,除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素(2)根据值x[x==10]#等于10的元素x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素Part2:数据框将示例数据放在你的工作目录下(! "bioinfoplanet.RData")#保存当前所有变量save(a,file="test.RData")#保存其中一个变量load("test.RData")#再次使用RData时的加载命令(5)
This is my day 3 homework of BIC by 生信星球.Content for today is software installation in Linux OS.1.