::opts_chunk$set(echo = TRUE,message=F,warning=F) R Markdown head(iris) plot(iris$Sepal.Length) 引用自生信技能树
Esc退出进入命令模式 : #进入行末模式 Esc退出进入命令模式 wq #在行末模式下,输入wq(退出保存) vimtutor zh_CN#查看中文帮助文档 3 生信常见格式 fasta:2行,有id行和序列行 fastq:4行,@开头,序列信息,+保留行,碱基质量值 gff/gtf:9列,序列名字,注释来源,基因结构,起始位置,终止位置,碱基测序结果可信度,链的+向与-向 #官网安装包地址 wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh #生信技能树安装包软链接地址 info -e conda env list # 每次运行前,激活创建的小环境rna conda activate rna # 退出小环境 conda deactivate 在小环境rna中安装生信软件 #上一个后台工作的进程PID号 $_ #获取在此之前执行的命令或脚本的最后一个参数 位置参数变量 $n #n是数字,$0代表命令本身,$1-$9代表1-9个参数,10以上的数字表示为 ${1111} $
clusterProfiler-book/index.html# GOplot:https://mp.weixin.qq.com/s/LonwdDhDn8iFUfxqSJ2Wew# 网上的资料和宝藏无穷无尽,学好R语言慢慢发掘~生信技能树
[]中括号里面的可以是逻辑值判断,可以是具体的值(即下标),可以是函数,可以是向量
视为一个整体,一个向量只能有一种数据类型,可以有重复值)数据框(约等于表格,一列只能有一种数据类型)矩阵列表4.1 向量的生成c(2,3,15,5,7)## [1] 2 3 15 5 7c(1:9) ## [1] 1 2 3 4 5 6 7 8 9rep("x",times=3)## [1] "x" "x" "x"##有重复的用rep(),有规律的序列用seq(),随机数用rnorm()seq(from =3,to=21,by=3)## [1] 3 6 9 12 15 18 21paste0(rep("x",times=3),1:3)## [1] "x1" "x2" "x3"###paste0函数是把数据连在一起
SS2_15_0048_A4" ## [5] "SS2_15_0048_A5" "SS2_15_0048_A6" "SS2_15_0048_A7" "SS2_15_0048_A8" ## [9] "SS2_15_0048_A9" "SS2_15_0048_A10" "SS2_15_0048_A11" "SS2_15_0048_A12"## [13] "SS2_15_0048_A13" "SS2 [29] "SS2_15_0048_B5" "SS2_15_0048_B6" "SS2_15_0048_B7" "SS2_15_0048_B8" ## [33] "SS2_15_0048_B9" ", color="#4D9DDA", alpha=0.8)+ facet_grid(plate ~ .) p4图片图片#13.使用ggpubr把上面的图进行重新绘制。 # 201 0048 17 SS2_15_0048_I9## 457 0049 11 SS2_15_0049_D1## 715 0049 9 SS2_15_0049_
后起之秀奔涌而至,欢迎大家在《生信技能树》的舞台分享自己的心得体会! ssGSEA GSEA分析,jimmy老师在《生信技能树》公众号多次讲解: GSEA分析一文就够(单机版+R语言版) GSEA的统计学原理试讲 GSVA或者GSEA各种算法都是可以自定义基因集的 但实际上 cells CD4 naive" # [7] "T cells CD4 memory resting" "T cells CD4 memory activated" # [9] 8),col=mypalette_1,xlab="Greens (sequential)", ylab="",xaxt="n",yaxt="n",bty="n") set1里面配色最多9种 (1:10),col=mypalette_1,xlab="Greens (sequential)", ylab="",xaxt="n",yaxt="n",bty="n") 会发现还是只有9种
2.在R包homologene里有张基因对应表 同时已经有可以转换的代码可用 homologene(genes, inTax, outTax) genes:需要查找同源基因的基因列表 inTax:输入基因所属物种 outTax:查找的同源基因属于那个物种
arrange(test, desc(Sepal.Length)) #从大到小 desc()
## 8 8 q.8 TRUE 9 10 ## 9 9 q.9 TRUE 10 11 ## 10 10 q.10 TRUE 11 12 m3$f=c(4:13) m3 ## ## 7 7 q.7 TRUE 8 9 10 ## 8 8 q.8 TRUE 9 10 11 ## 9 9 q.9 TRUE 10 11 12 ## 10 10 q.10 (参考B站生信小技巧获取runinfo table) SraRunTable <- read.table("http://www.bio-info-trainee.com/tmp/5years/SraRunTable.txt 19 16 16 14 15 16 11 4 6 ## [262] 14 16 6 13 6 11 9 11 5 13 11 7 12 10 9 5 9 4 8 5 9 6 13 9 9 8 6 8 16 9 11 2 5 6 9 ## [378] 10 10 7 14 6 10 4 1 4 9 5 11 7 14 5 4 15 15
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、文件读写1. id## 2 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 3 142aea0e-7a7b-4ac4-9dbb id## 1 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 2 142aea0e-7a7b-4ac4-9dbb -0f62e2379599## 3 9d951ff8-ce21-4c69-86f2-0d1eeb2e40e3## filename
如果代码可以运行但是不出图,可能是因为画板被占用,可以多次dev.off()关闭画板
check.names = F,row.names = 1,header = T) #逆转log dat = as.matrix(2^dat - 1) dat[1:4,1:4] # 深坑一个 dat[97,9] as.character(dat[97,9]) #眼见不一定为实吧。
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、函数和R包1. 函数与参数图片图片jimmy <- function(a,b,m = 2){ (a+b)^m}jimmy(a = 1,b = 2)## [1] 9jimmy(1,2)## [1] 9jimmy(3,6 R符号图片9. 认清函数和数据图片10. 解决问题的秘诀图片
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、数据框、矩阵和列表1. 矩阵新建和取子集图片m <- matrix(1:9, nrow = 3)colnames(m) <- c("a","b","c") #加列名m## a b c## [1,] 1 4 7## [ 2,] 2 5 8## [3,] 3 6 9m[2,]## a b c ## 2 5 8m[,1]## [1] 1 2 3m[2,3]## c ## 8m[2:3,1:2]## a b## [ 矩阵的转置和转换图片t(m)## [,1] [,2] [,3]## a 1 2 3## b 4 5 6## c 7 8 9class(m)## 列表的新建与取子集图片#列表l <- list(m1 = matrix(1:9, nrow = 3), m2 = matrix(2:9, nrow = 2))l## $m1##
---title: "生信技能树学习笔记"author: "天空"date: "2023-01-04"output: html_document---R语言综合应用1. <e9>\u0098<b5><e7>\u0094<bb>箱线<e5>\u009b<be>.R" ## [6] "5_<e9>\u009a\u0090<e5><bc [17] "test2.Rdata" ## [18] "<e7>\u0094\u009f信< e6>\u008a\u0080<e8>\u0083<bd><e6><a0>\u0091<e7><ac>\u0094记day7.html" ## [19] "<e7>\u0094\u009f信<e6> <e9>\u0098<b5><e7>\u0094<bb>箱线<e5>\u009b<be>.R" ## [6] "5_<e9>\u009a\u0090<e5><bc
dat_symbol, by ='symbol') #至此完成了探针过滤,加基因名等操作 #取对数 genes_expr <- log2(dat+1) heat_expr <- genes_expr[,-c(2,9) install("hugene10sttranscriptcluster.db",ask = F,update = F) options()$repos options()$BioC_mirror Task9:
probe_id, rownames(exp)),]) exp_filter_no_symbol2 <- as.data.frame(exp[rownames(exp) %in% ids$probe_id,]) 9 exp_clust_dist,'ward.D') library(factoextra) fviz_dend(hc, k=4, cex = 0.5, k_colors = c("#2E9FDF 值画散点图,看看哪些基因相差很大 deg_t.test <- as.data.frame(deg_t.test) t_limma_pval <- cbind(deg_t.test,DEG)[,c(4,9)
unexpected,一般是代码有误some tips1 Tab-打出前几个字母即出现提示,按↑↓翻动,按Tab补全2 光标放在>后面,按↑键,即可修改上一条命令,按回车重新运行图片图片(格式重于内容)引用自生信技能树
tony 152")str_split(y," ")str_split(y," ",simplify = T) #简化结果 拆分后的y需要赋值,不然还是原来的y3.按位置提取字符串str_sub(x,5,9) #空格也要算上 x字符串里5-9位置4.字符检测str_detect(x2,"h") # h类似于地雷,扫雷探测,含有h的就会变成TURE,生成长度相等的逻辑值向量,可以用来取子集,可以提出来含有h的地雷