引自生信技能树引自生信技能树DAY3三、数据结构——数据框1、数据框的来源(1)用代码新建(2)由已有数据转换或处理得到(3)读取表格文件(4)R语言内置数据注意:向量是一维的,且只存储一种数据类型;matrix 与向量长度相等且一一对应df1$gene[df1$score>0](2)删除变量# 删除 #赋了一个值发现它没有用,然后把它删掉rm(x)rm(df1,df2)rm(list = ls()) ctrl+l#清空控制台引自生信技能树 10,mean=0,sd=18),用向量取子集的方法,取出其中小于-2的值z = rnorm(n=10,mean=0,sd=18)zz[z< -2]z[z<(-2)]四、函数与R包1、函数与参数引自生信技能树 #<-之间要有空格或打个括号,不然会被当成赋值符号2、R包介绍3、R包镜像引自生信技能书使用镜像,加快R包的下载,不用从大洋彼岸去下载4、R包的安装与来源(1)CRAN网站(2)Bioconductor sdlibrary(limma)browseVignettes("limma") #不是每个包都有ls("package:limma")5、R包的安装和使用逻辑引自生信技能书引自生信技能树练习题4-1#
因为我用的是自己的MacBook的terminal,第一个指令wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- 下成Linux版了,死活安装不了……最后发现应该选mac版:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- 总之就是为了加快速度…………接下来正式使用conda:conda install fastqc -y(-y)很关键最后加一个conda环境:conda create -n rna-seq python=3 fastqc trimmomatic -y搞一个python版本是3的conda环境来安装fastqc、trimmomatic。
R 语言与 C 语言都是贝尔实验室的研究成果,但两者有不同的侧重领域,R 语言是一种解释型的面向数学理论研究工作者的语言,而 C 语言是为计算机软件工程师设计的。
session(交互式会话),restartR将R重启(快捷键:ctrl+shift+F10),解决R90%的问题
#本文引用自生信技能树 【课前概念辨析】 1. 不在行列统计范围内】 df1.csv gene change score 1 gene1 up 5 2 gene2 up 3 3 gene3 down -2 3)按坐标取子集,用中括号表示[行,列]: gene change score 1 gene1 up 5 2 gene2 up 3 3 gene3 down - 3 6 > m a b c [1,] 1 4 7 [2,] 2 5 8 [3,] 3 6 9 (7)注意: #单独as的时候! 3] [1,] 1 4 7 [2,] 2 5 8 [3,] 3 6 9 $m2元素 [,1] [,2] [,3] [,4] [1,]
-2,-4)) df1 ## gene change score ## 1 gene1 up 5 ## 2 gene2 up 3 ## 3 gene3 down 3 nrow(df1) ## [1] 4 ncol(df1) ## [1] 3 #行名 列名 rownames(df1) ## [1] "1" "2" "3" "4" colnames(df1) ## [1] 1 2 3 m[2,3] ## c ## 8 m[2:3,1:2] ## a b ## [1,] 2 5 ## [2,] 3 6 m ## a b c ## [1,] 1 4 7 ## [2,] 2 5 8 ## [3,] 3 6 9 t(m) # 转置 ## [,1] [,2] [,3] ## a 1 2 3 ## b 4 5 6 [1] "jimmy" "Damon" "Sophie" 删除变量 rm(x) rm(df1,df2) rm(list = ls()) # 清空控制台 快捷键ctrl+L 数据结构的总结 引用自生信技能树
今天的笔记是自己记的Goodnotes,字比较丑请见谅…………关于测序的入门,零基础的非常推荐【陈巍学基因】视频1,讲的很清晰,可以对二代测序有一个最基本的了解。 分析软件可以选择fastqc,linux中可以直接用wget安装`unzip fastqc_v0.11.7.zip`-->`cd FastQC`-- >`chmod755 fastqc`chmod 用3个数字来表达对
下载miniconda:terminal登陆linux后输入wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64 .sh想用2就python2 + xx.py; 想用3就python3 + xx.py2. 安装miniconda:bash Miniconda3-latest-Linux-x86_64.sh3. 输入自己的安装路径【友情提示:可以放到家目录的bashrc下,方便以后修改。 软件安装1)conda install 软件名称(ex.cutadapt)2)软件更新 : conda update 软件名3)若不确定软件名称,可以先使用搜索: conda search fastqc4 conda create -n rna-seq python=3 fastqc trimmomatic -y。。。。。。。。(后续内容不太理解 抽空重新学习 conda环境)
1、将miniconda下载到服务器上wget +下载链接(下载链接https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- latest-Linux-x86_64.sh)2、安装minicondastep1:安装bash Miniconda3-latest-Linux-x86_64.sh (按提示操作,直至thank you for installing Miniconda3)step2:激活source ~/.bashrc(验证激活,输入conda出现满屏信息代表激活成功) 如果激活不成功,删除文件(rm -r /home /bio06/miniconda3),重新安装3、添加镜像# 使用中科大的镜像conda config --add channels https://mirrors.bfsu.edu.cn/anaconda condastep1:查看当前服务器上安装的所有软件列表conda liststep2:安装软件conda install fastqc -y 【-y是yes,安装过程中conda问你的问题全部回答yes】step3:
下面是2022年3月_生信入门班_微信群答疑笔记 老师,我的Rstudio 怎么只有两个窗口了,该怎么调呀? 如果你基础已经很好了,那你可以看一下生信技能树b站你感兴趣的教程。有问题可以在群里问,但是如果你问的问题是你由于你基础不过关导致的,那还是要把基础课程看一遍。 老师我卡在第一步了, 好像是我的密码不对 登录名,ip,密码是3个不同的东西,你可以通过ssh来登陆我们生信技能树的服务器,使用下面的命令 ssh Mar20@49.232.173.27 然后你的密码是 可以,但是太少了,tcr或者bcr测序,可以测一千多万个b和t细胞的 cdr3区域,非常丰富,但是wes或者rna-seq会分担给两万个基因,所以在cd3r上面的少得可怜哦。 sd函数不能接受3个参数,把它们c起来
2.粗略了解R语言是什么,干什么的,认识Rstudio的工作界面四个象限分别代表:编辑器对象/变量+历史命令脚本运行与结果显示文件/图片/包3.学会外观设置和基本操作从最简单的函数开始plot(rnorm
有几个问题,如果数据没处理完,或者a还没被赋值的时候,save a 会报错,提示找不到a;最后的plot,即是以R内置的iris数据中的两列数据作散点图,出现一个最基础的、x轴y轴一一对应的图像。
(library() : library(package)将加载名为package的命名空间,并添加到包的搜索列表中。加载前对搜索列表进行检查并更新,如果package不存在则报错,如果之前已加载package,则不会重复加载。如没有参数package即library(),则列出lib.loc指定的库中的所有可用包。library(help=package)将返回package的基本信息。
No.1 生物信息学 生物信息学(Bioinformatics),简称生信,是一门在人类全基因组测序工程和计算机工程基础上迅速发展起来的新兴交叉学科,目前主要定位于精准医疗,适用于复杂性状的基因定位 欢迎大家入门生信与临床,今后我将会和大家经常分享一些生信和临床知识!
测序原理测序是测生物体的遗传信息一代测序:sanger发明的70年代的双脱氧终止反应法原理如下:DNA的基本组成单位是单脱氧核苷酸(dNTP),dNTP5点位和3点位各有一个羟基。 sanger合成了3点位没有羟基的核苷酸(ddNTP),由于无法与下一个dntp形成磷酸二酯键,终止了DNA的聚合反应。
xshell)ssh 用户名@ip地址图片常用的linux指令1. pwd (print working directory 显示当前路径)2. mkdir (make directory 创建空目录)3. ls(显示列表 文件or目录都可)4. rm1)删除文件——rm2) 删除空目录--rmdir3) 删除非空目录--rm -rTIP:图片5. cd接一个目录名称(进入该目录)直接cd不加目录名直接返回主目录 否则下面的命令都没办法运行head 接文本文件名,默认输出前10行,tail 接文本文件名,默认输出后10行,后面加上-n 自定义输出几行(例如:head -n 3 hello_world.txt 【注意 -n与head之间有空格,-n和3之间空格可有可无)图片8. cp (复制文件)使用:cp hahaha 哈哈哈就是复制hahaha,命名为哈哈哈的意思。
我就是分享一些生信基础的生信分析技能,以满足大家在科研工作中的生信需求。说实话,大家需要给你自己以定位,自己做纯生信的还是只是借助生信为大家在湿实验中提供思路,或者文章中添加一些生信内容。 这里按照我个人的学习经历和总结,让刚刚入门的你,能快速学习一些基础的生信技能,学到高水平我也做不到,因为我自己也觉得自己很菜的,但有一些经验可以分享给大家。 1.首先给自己一个定位,你学生信为了干什么? 如果你不是纯生信的,比如做一些药理,分子生物学等相关以实验为主,那么你学习生信主要还是做一个辅助,你可能注重的还是一些基础分析。 3.是否需要学编程语言? 哪怕你不做纯生信,R语言是必须学习的,为什么?很多人就是想用别人的代码傻瓜似的运行,然后得出结果,这个过程往往会出现各种幺蛾子,会浪费你大部分的时间。 对于其他的书籍可以参考之前的文章:这才是生信入门的书籍清单。
anaconda是总管,职务比conda低,但干的活不少,也是个有内涵的家伙miniconda是区域经理,说白了就是干事的,而且比较专一,主要负责生信领域二、如何下载软件1.创建biosoft(mkdir biosoft(cd biosoft)2.从某链接下载软件:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3- latest-Linux-x86_64.sh生信星球:sh是脚本(就是一个程序,后台的代码)文件的后缀,也就是说其实这是一个下载的脚本。 然后出现这个界面:3.下载完成后,运行 :bash Miniconda3-latest-Linux-x86_64.sh,然后开始安装过程4.激活:source ~/.bashrc(注意空格)生信星球:激活不成功就将 add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/conda config --set show_channel_urls yes生信星球三
#筛选score > 0的基因df1[df1$score > 0,1]df1$gene[df1$score > 0]#5.数据框修改#改一个格df1[3,3] <- 5df1#改一整列df1$score mm[2,]m[,1]m[2,3]m[2:3,1:2]mt(m):转置 行变列m<-as.data.frame(m) 转换为数据框 必须要赋值矩阵画热图: pheatmap::pheatmap(m) rm(df1,df2)rm(list = ls()) 改变列的顺序a <- a[,c(1,3,4,2)]练习3-1# 练习3-1# 1.读取exercise.csv这个文件,赋值给test。 ="b",]test[test$Species=="a"|test$Species=="c",]test[test$Species %in% c("a","c"),]练习3-2# 练习3-2# 1.统计内置数据 (a))a# 4.探索列表取子集l[2]和l[[2]]的区别(提示:数据结构)class(l[2])class(l[[2]])图片引自生信技能树
查看服务器 uname -a1.好的,是你64-bit(x86_64)2.3.下载成功未安装,需要运行这句代码(问啥回答啥)bash Miniconda3-latest-Linux-x86_64.sh conda config --set show_channel_urls yes使用conda查看当前服务器上安装的所有软件列表 conda list安装软件 conda install fastqc -y 3尝试不加 fastqc -y(先不试)选修conda 环境 分身就是不同的“conda environment”为了满足不同项目需要的相同软件的不同版本1.查看conda有哪些环境(带*已激活)2.创建也成功了3. 成功成功,芜湖~4.退出当前环境conda deactivate 代码引用生信星球,说明部分引用生信星球心得,感觉今天比昨天简单,嘻嘻~