生信学习第四天之R语言生信学习第四天之R语言1R语言学习和了解1.1 之前就安装过R和Rstudio,浅学习过《r语言实战》,及基本的语言。后续可以再计划学习R for Data Science。
生信学习之第五天R语言实操1.R语言基本数据类型重点掌握向量和数据框,明确元素、向量、标量的定义元素:数字或者字符串(chr)标量:一个元素组成的变量向量:多个元素组成的变量图片2.提取元素2.1向量x
生信学习第二天1.登录服务器,下载安装好xshell7、xftp7等软件,根据账号密码和ip地址等信息正确远程登录服务器2.学习了解什么是linux系统及它的用处2.1 Linux系统下所有皆由“文件夹组成
生信学习第三天1 生信软件的安装图片2 具体安装步骤2.1 百度搜索清华镜像下的安装链接=》进入:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda
DAY1--生信学习前准备1学习方式,使用电脑进行学习,与小伙伴交流讨论,共同进步2解决问题,利用搜索引擎学会搜索,推荐虫快搜部落,去解决学习过程中的问题3提高效率的软件,浏览器推荐如chrome,电脑文件搜索 ,Windows用everything,Mac自带搜索;快捷截图软件snipaste或者电脑版微信;思维导图记录,推荐xmind,便于后期整理回顾学习4学习Markdown语法做笔记4.1展示代码a=14.2
本篇内容引自生信技能树 DAY7-9 课前提问: 1、为什么要做数据挖掘? 即用别人的数据用在自己的文章里面,多半是从别人的数据里筛选自己想要的基因。 step2output.Rdata") #比较复杂的探针注释参考资料 #资料1:拆分取列https://www.yuque.com/xiaojiewanglezenmofenshen/kzgwzl/sv262capcgg9o8s5
里的第二栏里,带“--”说明不对应任何symbol,需要删去 7、一个探针对应多个基因(非特异性探针),难以解释,这些行直接去掉 8、对于lnkRNA不能直接用页面上的TargetID,尽量寻找symbol列 9、 str_detect(pd$title,"and");table(keep) exp = exp[,keep] pd = pd[keep,] 总结: 小洁老师讲的真的非常好,细腻又形象,准备学生信的一定要来学一波让你丝滑入门
百度网盘里的软件下载链接: 链接:https://pan.baidu.com/s/1YVf9lvI5jiK_7pPcdAQtvA 提取码:glgk 一.认识R和Rstudio R是一种编程语言,也是统计计算和绘图的环境 查看这一篇,养成好习惯: https://mp.weixin.qq.com/s/G-LXN9P2HVLv9v0cvyFJMA 2.显示文件列表 直接打命令不跟路径会显示哪里?
R包是多个函数的集合,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。
(1)R的规范赋值符号是<-,也可以用=代替 (2)在Console 控制台输入命令,相当于Linux的命令行 (3)R的代码都是带括号的,括号必须是英文的。 (4)显示工作路径 getwd() (5)向量是由元素组成的,元素可以是数字或者字符串。 (6)表格在R语言中称为数据框^_^ (7)别只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:?read.table,调出对应的帮助文档,翻到example部分研究一下。 (8)数据类型(重点只有两个)
[]中括号里面的可以是逻辑值判断,可以是具体的值(即下标),可以是函数,可以是向量
视为一个整体,一个向量只能有一种数据类型,可以有重复值)数据框(约等于表格,一列只能有一种数据类型)矩阵列表4.1 向量的生成c(2,3,15,5,7)## [1] 2 3 15 5 7c(1:9) ## [1] 1 2 3 4 5 6 7 8 9rep("x",times=3)## [1] "x" "x" "x"##有重复的用rep(),有规律的序列用seq(),随机数用rnorm()seq(from =3,to=21,by=3)## [1] 3 6 9 12 15 18 21paste0(rep("x",times=3),1:3)## [1] "x1" "x2" "x3"###paste0函数是把数据连在一起
生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python Reference 一些练习题 给定FASTA
"two" "three" "four" "five" 构建等差数列、重复数列> seq(from=1,to=100,by=2)#从1到100,通过2来排序 [1] 1 3 5 7 9 (x)#函数length计算向量的长度[1] 10> x[1]#通过方括号来检索查找向量中第几位的值[1] 1> x[-1]#列出除了第1位所有的值[1] 2 3 4 5 6 7 8 9 10> y[c(T)]#循环输出TRUE所有的值 [1] 1 2 3 4 5 6 7 8 9 10> y[c(T,F)]#循环输出对错对错的值[1] 1 3 5 7 9> y[c(T, >5]#检索大于5的值[1] 6 7 8 9 10> y[y>5 & y<9]#通过&来合并两个检索命令[1] 6 7 8> z<-c("one","two","three","four","five after = 8)#对向量v在第8位后面赋值9 [1] 1 2 3 4 5 6 NA NA 9 NA NA NA NA NA NA NA NA NA NA NA 20> v[2]<-4#
如果代码可以运行但是不出图,可能是因为画板被占用,可以多次dev.off()关闭画板
非常感谢您能够点击进来查看我的笔记。我致力于通过笔记,将生物信息学知识分享给更多的人。如果有任何纰漏或谬误,欢迎指正。 图片以上是我这次在学习生物信息学过程中所整理的笔记。如果大家对这个领域也感兴趣,欢迎加我好友,我的qq号是1841113542。希望大家能够一起学习,共同进步。 如果在笔记中有错误或者不足之处,欢迎大家指正,我们一起加油鸭引用自生信技能树——小洁老师
arrange(test, desc(Sepal.Length)) #从大到小 desc()
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、文件读写1. id## 2 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 3 142aea0e-7a7b-4ac4-9dbb id## 1 66e33592-2e6e-4e50-8a5b-8a3f902eb2b5## 2 142aea0e-7a7b-4ac4-9dbb -0f62e2379599## 3 9d951ff8-ce21-4c69-86f2-0d1eeb2e40e3## filename
mkdir biosoft #存放生信软件 mkdir project #存放生信项目 mkdir tmp #存放一些杂七杂八 mkdir src #存放源代码 第三个 ls ls 显示列表,不管是目录还是文件
---title: "生信技能树学习笔记"引用自生信技能树author: "天空"date: "2023-01-02"output: html_document---一、函数和R包1. 函数与参数图片图片jimmy <- function(a,b,m = 2){ (a+b)^m}jimmy(a = 1,b = 2)## [1] 9jimmy(1,2)## [1] 9jimmy(3,6 R符号图片9. 认清函数和数据图片10. 解决问题的秘诀图片