生信技能树学习笔记 Linux里的文件 1.文件的传输 2.文件的表示 文件夹管理或路径有关的符号: . 当前目录 .. SOURCE DIRECTORY 要说明:1.拷贝谁2.到哪儿去 ln:link 链接,分软链接(常用)和硬链接(默认). -j ## 将输出重定向给bzip2命令 -z ## 将输出重定向给gzip命令 常见用法: 解压:tar [参数] [待解压包] 压缩:tar [参数] <压缩后文件名> [待压缩文件/目录] 打包是指将一大堆文件或目录变成一个总的文件 Linux 中很多压缩程序只能针对一个文件进行压缩,这样当你想要压缩 一大堆文件时,你得先将这一大堆文件先打成一个包(tar命令),然后 再用压缩程序进行压缩(gzip、bzip2或zip命令)。 http://linux.51yip.com/ linux命令手册 Q2:有没有什么书籍可以系统地学习linux相关的知识?
权限控制多用户的权限控制命令行模式linux的操作靠命令行来实现目录结构文件系统呈树状,宿主目录放在home目录下2.为什么学生信要用linux? pwd: print working directory,也就是显示当前路径mkdir :make directory-- 创建你的空目录ls 显示列表,不管是目录还是文件,都能显示1 删除文件--rm2 删除空目录--rmdir3 删除非空目录--rm -rcd接一个目录名,表示进入该目录vi 新建脚本或者文本文档cat接文本文件的名字,查看并直接将文本文件的内容输出到屏幕head/tail 输出内容例如 :head -n 3 hello_world.txtcp file1 file2 复制mv 将文件移入文件夹,或者重命名bio09@ecm-cefa:~$ pwd/home/bio09bio09@ecm-cefa :~$ mkdir lidahuang #李大黄的文件夹bio09@ecm-cefa:~$ lslidahuangbio09@ecm-cefa:~$ mkdir test #测试文件夹bio09@ecm-cefa
seq(from = 2,to = 15,by = 2) ## [1] 2 4 6 8 10 12 14 # 2.生成向量,内容为:"student2" "student4" "student6 seq(2,100,2) ## [1] 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 "AC104581.1" "MPP2" "ATP2A2" "SNRPE" ## [19] "PRSS8" "ZNF461" "CECR5" "LCP1" ## [43] "OR2D3" "LIPE" "LIPE" "CANX" "ATP6V1B2" "MARC2" z = rnorm(n=10,mean=0,sd=18) z[z<(-2)] ## [1] -4.657298 -8.565170 -18.576409 -2.250447 引自生信技能树 This
① 服务于supercomputer的OS② 开源,能方便运行大量数据2、常用linux代码pwd #显示当前路径mkdir … #创建空目录ls #显示列表rm … #删除文件rmdir … #删除空目录rm -r … #删除非空目录,也可删除空目录rm -rf/ … #强制清空,需管理员权限cd … #进入该目录cd - #返回刚刚的目录cd head … #显示前10行tail … #显示后10行head -n3 … #显示前3行|3可替换tail -n3 … #显示后3行cp file1 file2 #复制file1,命名file2mv #移动或重命名图片生信星球学习小组
图片——来源:生信星球2.为什么学生信要用linux?(1)生物软件基于linux,系统开源、免费,不需要图形界面,有效节约资源。(2)命令行模式可以批量、高效地处理文件,满足数据分析的要求。 3.怎样召唤linux--阿里云服务器(1)单纯linux,用U盘安装一下纯linux系统,推荐CentOS或者Ubuntu整个过程大概只需要20分钟;(2)Windows10上的linux(3)本地服务器上的 它被广泛应用于网络管理员、开发人员和IT专业人员之间,以便于他们可以安全地在图形界面中管理远程主机。Xftp 是一款基于 Windows 的文件传输软件,用于通过网络安全地传输文件。 (5)本地服务器上的linux(6)云服务器上的linux4.怎样登录服务器--xshell和terminalterminal—苹果用户针对wins需要安装Xshell,安装在默认文件夹最好,不安装在默认文件夹安装不上 同时安装Xftp如何登录生信星球https://www.jianshu.com/p/8a340b103a411.ip地址。ip是代表服务器的一个“编号”。2.用户名。bio开头的那个3.密码。
介绍 2. 安装 2.1 Conda 安装 2.2 传统安装 3. 使用 3.1 下载SRA 3.2 抽取fastq文件 1. 介绍 Sratools是NCBI官方提供,用于操作SRA (reads and reference alignments) 数据的工具集合 一般常用于下载SRA文件,从SRA文件中提取fastq,sam 文件,查看SRA文件信息等 2. 这里提供两种方法,选择一种安装即可,强烈建议使用Conda方式安装 2.1 Conda 安装 conda install -y sra-tools 这里需要安装Conda (一款用于安装多数生物信息分析软件的管理软件 cmd=show&f=software&m=software&s=software 下载地址2:https://github.com/ncbi/sra-tools/wiki/Downloads 在
title=sample$Titletitle## [1] "SS2_15_0048_A1" "SS2_15_0048_A2" "SS2_15_0048_A3" "SS2_15_0048_A4 25] "SS2_15_0048_B1" "SS2_15_0048_B2" "SS2_15_0048_B3" "SS2_15_0048_B4" ## [29] "SS2_15_0048_B5" "SS2_15_0048_B6" "SS2_15_0048_B7" "SS2_15_0048_B8" ## [33] "SS2_15_0048_B9" "SS2_15_0048_B10" "SS2 _0048_C2" "SS2_15_0048_C3" "SS2_15_0048_C4" ## [53] "SS2_15_0048_C5" "SS2_15_0048_C6" "SS2_15_0048 SS2_15_0048_N23" "SS2_15_0048_N24"## [337] "SS2_15_0048_O1" "SS2_15_0048_O2" "SS2_15_0048_O3" "SS2
创建自己的会话,输入IP、用户名密码登录 Linux命令 pwd: print working directory 显示当前路径 图片 mkdir: make directory 创建空目录 mkdic后面要加上文件名或目录 touch: 这个命令可以创建文件文档 图片 ls:查看列表,查看文件目录 图片 rm: 删除 rm 删除文件 rmdir 删除空目录 rm-r 删除非空目录 ( rm+要删除的目录名字+ -r) rm-rf r是多个文件都删除 f是强制 图片 +cd: 进入目录 cd文件名 进入该文件 cd- 返回上一级文件目录 cd 返回主目录 图片 vi:新建文本并编辑 在编辑页面里,如果编辑好英文文字后,先按ESC head是查看文档前10行 tail是查看文档后10行 也可以 head -n 具体行数 文档名字 如: head -n3 hi.txt tail -n3 hi.txt 图片 cp: 复制 cp 原文件名字 +新命名文件名 cp hi.txt hihi.txt 图片 mv: 给文件重命名或者移动文件路径 mv hi.txt 路径 意思是移动hi文件到某路径下 mv hi1 hi2 意思是给hi1重命名为hi2
而不像微软的电脑用windows,苹果用mac,所以Linux需要一个服务器来载起它,不需要专门的电脑和它匹配,这个服务器就像配备精良的高端电脑 登录 登录成功了,但是没有理解1-9的练习内容 代码引用生信星球 就是从第四以后就感觉很奇怪,老师说的和我有运行的是两个东西 练习后的截图,有不对的请指正 1.print working directory(pwd),显示当前路径 /home/bio07 是我的当前路径 2. make directory-- 创建你的空目录 3.ls -显示列表,不管是目录还是文件,都能显示 4,5除了ls可以显示,还有别的路径能快速知道自己有什么文件以及删除了那些吗? 有什么能查看文件创建和删除吗?而不需要每次都用ls查看 6.7芜湖~有趣 8:使用:cp file1 file2 ,复制file1,命名为file2的意思。 ls -a # 显示当前目录中的所有文件和目录,包括隐藏文件 ls -lh # 以人类可读的方式显示当前目录中的文件和目录大小
Day1引自生信技能树一、R与Rstudio1、什么是R编程语言;环境2、什么是Rstuio集成开发环境3、如何在Rstuio中新建项目project引自生信技能树4、新建脚本script引自生信技能树 5、Rstuio介绍引自生信技能树6、面板显示和字号设置引自生信技能树引自生信技能树7、与R语言交互(1)控制台窗口(2)脚本编辑器(逐行运行ctrl+enter;选中运行ctrl+A)(3)使用“#” ,忽略# 练习2-2# 1.生成1到15之间所有偶数,并用代码查看a的内容a = seq(from = __,to = __,by =__)a#答案:2,14,2# 2.生成向量,内容为:"student2 (2)数学计算(3)连接(4)交集、并集、差集引自生信技能树引自生信技能树老师提问:若两边的y各增加一个元素2,那么两边产生的逻辑值的个数分别为5和4。 4、向量取子集(1)按照逻辑值取(2)按照位置取引自生信技能树#####2.4.向量筛选(取子集)--看ppt#####x <- 8:12#根据逻辑值取子集x[x == 10]x[x < 12]x[x
这里记录每周值得分享的生信相关内容,周日发布。 本杂志开源(GitHub: ShixiangWang/weekly[1]),欢迎提交 issue,投稿或推荐生信相关内容。 封面图 本周话题:生信的境界与道路[5] 华中科技大学教授薛宇翻译生物信息学研究的5个层次水平并加入自己的理解: 0级(Level 0):为建模、而建模(modeling for modeling’ 希望每一位生信学习者都能从渣打到神级。 如果读者对本期话题感兴趣,欢迎到讨论区评论交流。 生信科技动态 1、第十届全国生物信息学与系统生物学学术大会 全国生物信息学与系统生物学学术大会自1998年首届召开以来,已成功举办九届,是中国生物信息学研究领域学术水平最高、影响最大的全国盛会。 /issues/4 [4] via: https://www.alifeoverseas.com/what-in-the-world-to-do-with-newbies/ [5] 生信的境界与道路:
ggplot2参数设定① 形状(shape)标识选择图片② color & fill 区分:color指边框颜色,fill指内容物颜色,如果二者颜色不一致,color和fill都要写③ 分面:指按照数据的某一列把数据分成几张子图
2023.06.27linux入门图片主要的语法练习显示路径图片显示列表ls #显示列表图片创建空目录mkdir #创建空目录图片删空目录图片删文件rm rmdir 删空目录 rm-r 删非空目录图片 vi 创建文本 cat 查看文本图片查看前/后十行图片查看前几行图片移动 重命名图片引用生信星球
(4)通过组合,产生更为复杂的向量paste0(rep('x',times=3),1:3) #[1] "x1" "x2" "x3"2. )#[1] 1 2 5x=c(1,2,5);x#[1] 1 2 5#其中 “;” 使R中两句或多句代码可以写在同一行上,否则会报错!! ',times=7),seq(from=2,to=15,by=2)) #利用循环补齐简化如下paste0('student',seq(2,15,2))(4)集合运算(不是等位运算)intersect( ) #交union() #并setdiff(x,y) #补,注意有先后顺序x=c(1,2,3,4)y=c(2,2,3,4)setdiff(x,y)#[1] 1setdiff(y,x)#numeric d'),each=3);k2boxplot(k1~k2) #以k1为纵坐标,k2为横坐标画图小TIPS:关于rep()的作用rep('x',times=3)#[1] "x" "x" "x"rep(c(
kan一下昨天的知识 day2复习一下markdown linux系统参考文献:生信星球pwdvi wcs.txt要记得用回车键分隔开,不然会沿用上个指令。 day2新的平台/工具1.xshell软件:就是远端控制云服务器的模拟器?是桥梁?衔接电脑和服务器的? cp file1 file2 复制第二份文件mv move? mv file1 file2 却是重命名的意思对负基础来说,下载,登录,看教程,操作,做笔记,2h不够,看人真准肝思维导图,冲。
登陆mac(终端terminal)win(下载xshell)ssh 用户名@ip地址图片常用的linux指令1. pwd (print working directory 显示当前路径)2. mkdir (make directory 创建空目录)3. ls(显示列表 文件or目录都可)4. rm1)删除文件——rm2) 删除空目录--rmdir3) 删除非空目录--rm -rTIP:图片5. cd接一个目录名称 (进入该目录)直接cd不加目录名直接返回主目录(home)6. vi (新建脚本or文本文档)(vi是linux中的文本编辑器)图片7. catcat 接文本文件的名字,查看并直接将文本文件的内容输出到屏幕 否则下面的命令都没办法运行head 接文本文件名,默认输出前10行,tail 接文本文件名,默认输出后10行,后面加上-n 自定义输出几行(例如:head -n 3 hello_world.txt 【注意 图片9. mv (移动or重命名)mv file 路径是移动file到某路径下图片mv file1 file2是将file1重命名为file2图片
文件读写1. 用project管理工作目录报错:文件不在工作目录下 no such file or directory/拼写错误(tab补齐或复制)显示文件后缀2.文件读取# read.系列函数# read.table #2.读取ex2.csvex2 <- read.csv("ex2.csv") # 行名当成了第一列并加了列名x;列名中_特殊字符被转化为.ex2 <- read.csv("ex2.csv",row.names 数据框导出write.csv(ex2,file = "example.csv")write.table(ex2,file = "example.txt") # 写文件名的时候把后缀带上4. 引用自生信技能树
介绍 SAM(sequence Alignment/mapping) 数据格式是目前高通量测序中存放比对数据的标准格式 转换 BAM 与 SAM 格式 比对文件排序,建立fastq索引 安装 conda install -y samtools 这里需要安装Conda (这是一款用于安装多数生物信息分析软件的管理软件,重要的是可以解决软件依赖问题) : Conda 安装使用图文详解 使用 1、常用的三个步骤 转换 SAM 格式为 BAM 格式 samtools view -S SRR00000.sam -b > SRR00000.bam 对比对后文件进行排序 samtools sort SRR00000. bam -o SRR00000_sorted.bam 对排序后文件建立索引 samtools index SRR00000_sorted.bam 通常以上的三个步骤是依次进行 2、格式转换 sam
开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 一些练习题 给定 FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分) open(file) for .. in loop print() strip () function 用到的知识点 给定FASTQ格式的文件(test1.fq), 写一个程序 cat.py 读入文件,并输出到屏幕 (2分) 同上 用到的知识点 写程序 splitName.py, (4分) 逻辑与操作符 and 文件中读取的内容都为字符串,需要用int转换为整数,float转换为浮点数 用到的知识点 写程序 transferMultipleColumToMatrix.py 将文件 (5分) 输入文件格式(mir.collapse, tab-分割的两列文件,第一列为序列,第二列为序列被测到的次数) ID_REF VALUE ACTGCCCTAAGTGCTCCTTCTGGC
R 语言与 C 语言都是贝尔实验室的研究成果,但两者有不同的侧重领域,R 语言是一种解释型的面向数学理论研究工作者的语言,而 C 语言是为计算机软件工程师设计的。