---title: "生信技能树学习笔记"author: "天空"date: "2023-01-04"output: html_document---R语言综合应用1. ## [7] "6_两个<e6>\u0095<b0><e6>\u008d<ae><e6><a1>\u0086<e7>\u009a\u0084<e8><bf>\u009e<e6>\u008e<a5>.R " ## [8] "7_<e4><b8>\u0080<e4><ba>\u009b顶<e5>\u0091<b1><e5>\u0091<b1><e7>\u009a\u0084<e5>\u0087< \u0094\u009f信<e6>\u008a\u0080<e8>\u0083<bd><e6><a0>\u0091<e7><ac>\u0094记day7.html" ## [19] "<e7>\u0094 \u009f信<e6>\u008a\u0080<e8>\u0083<bd><e6><a0>\u0091<e7><ac>\u0094记day7.Rmd"dir(pattern = ".R$") #列出工作目录下以
x2 = str_split(x," ")[[1]];x2 #是list 所以用[[]]
::opts_chunk$set(echo = TRUE,message=F,warning=F) R Markdown head(iris) plot(iris$Sepal.Length) 引用自生信技能树
因为这个cytoscape软件并不是很方便下载,而且上面大量的插件都比较麻烦,所以我们打包了它们在百度云盘和腾讯微云给大家,还包括一些图文并茂的教程,而且提供微信交流群方便大家互相帮助,分享高分文章的绚丽的网络图
-c #统计字节数,空格也算 cut #文本切割 -d #默认分隔符,\t -f #输出哪几列 less -S Data/example.gtf | cut -f 1,3-5,7 Esc退出进入命令模式 : #进入行末模式 Esc退出进入命令模式 wq #在行末模式下,输入wq(退出保存) vimtutor zh_CN#查看中文帮助文档 3 生信常见格式 }' | less -S cat example.gtf | awk '/UTR/{print $0}' | less -S cat example.gtf | awk '/UTR/{print $7, _64.sh #生信技能树安装包软链接地址 cd ~ ln -s /home/t_linux/Miniconda3-latest-Linux-x86_64.sh ./ #安装 输入yes或者enter info -e conda env list # 每次运行前,激活创建的小环境rna conda activate rna # 退出小环境 conda deactivate 在小环境rna中安装生信软件
2.在R包homologene里有张基因对应表 同时已经有可以转换的代码可用 homologene(genes, inTax, outTax) genes:需要查找同源基因的基因列表 inTax:输入基因所属物种 outTax:查找的同源基因属于那个物种
[]中括号里面的可以是逻辑值判断,可以是具体的值(即下标),可以是函数,可以是向量
数据结构向量(一串数据,数据框中单独拿出一列是向量,视为一个整体,一个向量只能有一种数据类型,可以有重复值)数据框(约等于表格,一列只能有一种数据类型)矩阵列表4.1 向量的生成c(2,3,15,5,7) ## [1] 2 3 15 5 7c(1:9)## [1] 1 2 3 4 5 6 7 8 9rep("x",times=3)## [1] "x" "x" "x"##有重复的用rep(),有规律的序列用 等位运算(2)向量长度不相等以长的为主paste0("student",seq(2,5,2))## [1] "student2" "student4"paste0(rep("student",times=7)
_A2" "SS2_15_0048_A3" "SS2_15_0048_A4" ## [5] "SS2_15_0048_A5" "SS2_15_0048_A6" "SS2_15_0048_A7" _B2" "SS2_15_0048_B3" "SS2_15_0048_B4" ## [29] "SS2_15_0048_B5" "SS2_15_0048_B6" "SS2_15_0048_B7" _C2" "SS2_15_0048_C3" "SS2_15_0048_C4" ## [53] "SS2_15_0048_C5" "SS2_15_0048_C6" "SS2_15_0048_C7" _D2" "SS2_15_0048_D3" "SS2_15_0048_D4" ## [77] "SS2_15_0048_D5" "SS2_15_0048_D6" "SS2_15_0048_D7" _E2" "SS2_15_0048_E3" "SS2_15_0048_E4" ## [101] "SS2_15_0048_E5" "SS2_15_0048_E6" "SS2_15_0048_E7"
后起之秀奔涌而至,欢迎大家在《生信技能树》的舞台分享自己的心得体会! ssGSEA GSEA分析,jimmy老师在《生信技能树》公众号多次讲解: GSEA分析一文就够(单机版+R语言版) GSEA的统计学原理试讲 GSVA或者GSEA各种算法都是可以自定义基因集的 但实际上 Plasma cells" # [5] "T cells CD8" "T cells CD4 naive" # [7] 0 0.00000000 # TCGA-GU-A42P-01A-11R-A23W-07 0.1414380 0 0.03075805 # TCGA-4Z-AA7W 0.11688532 # TCGA-DK-A3IM-01A-11R-A20F-07 0.04647556 # TCGA-GU-A42P-01A-11R-A23W-07 0.02934341 # TCGA-4Z-AA7W
geom_point(mapping = aes(x = Sepal.Length,
FastQC`-- >`chmod755 fastqc`chmod 用3个数字来表达对 用户(文件或目录的所有者),用户组(同组用户),其他用户 的权限: 如:chmod 755 fastqc 数字7是表达同时具有读 ,写,执行权限:(7 = 4 + 2+ 1) 读取--用数字4表示; 写入--用数字2表示; 执行--用数字1表示; 三者皆否:0将FastQC文件夹导入环境变量echo 'export PATH
生信星球1. 一二三代测序每一代测序都是为了解决上一代的问题,但又不完美一代测序准确度高,但通量低二代测序即高通量测序,但读长短三代测序读长长,但准确度低2.
arrange(test, desc(Sepal.Length)) #从大到小 desc()
## 6 6 q.6 TRUE 7 8 ## 7 7 q.7 TRUE 8 9 ## 8 8 q.8 TRUE 9 10 ## 9 9 q.9 TRUE 10 ## 5 5 q.5 TRUE 6 7 8 ## 6 6 q.6 TRUE 7 8 9 ## 7 7 q.7 TRUE 8 9 10 ## 8 8 q.8 (参考B站生信小技巧获取runinfo table) SraRunTable <- read.table("http://www.bio-info-trainee.com/tmp/5years/SraRunTable.txt 19 15 3 4 4 5 8 11 16 8 7 18 19 8 16 ## [349] 7 15 12 11 11 15 19 7 10 13 4 5 11 7 7 5 11 7 16 10 13 16 20 10 ## [465] 18 16 4 17 13 7 7 14 10 8 15 5 17 9 7 14 16 15 20 1 19 18
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、文件读写1. V1## 1 id## 2 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 3 142aea0e-7a7b 3,1:3]## id## 1 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 2 142aea0e-7a7b /soft.txt",header = T,fill = T) #其实不对soft2 <- read.table("day3/R_02/soft.txt",header = T,sep = "\t")7.
如果还是不行可以重启R studio & 电脑⑥神器eoffice导出library(eoffice)topptx(p, 'xxx.pptx') #导出的图片可以通过取消组合来局部修改#注意元素个数不能过多7️⃣
因为是癌症方面,自己不研究这一方面,所以不常用,但是GEO的转录组数据,是根据这个文件改写的
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、函数和R包1. 获取R包帮助之一方法:这个不好记图片7. 列出xxR里面的函数图片8. R符号图片9. 认清函数和数据图片10. 解决问题的秘诀图片