生信学习第6天之函数学习和操作1.R包是多个函数的集合,使用之前要加载合适的镜像,提高下载的速度。 1列或某几列对整个表格进行排序5.summarise():汇总6.管道操作 %>% (cmd/ctr + shift + M)7.count统计某列的unique值8.內连inner_join,取交集9.
本篇内容引自生信技能树 DAY7-9 课前提问: 1、为什么要做数据挖掘? 即用别人的数据用在自己的文章里面,多半是从别人的数据里筛选自己想要的基因。 gpl_number <- eSet@annotation;gpl_number save(pd,exp,gpl_number,file = "step1output.Rdata") # 原始数据处理的代码,按需学习 step2output.Rdata") #比较复杂的探针注释参考资料 #资料1:拆分取列https://www.yuque.com/xiaojiewanglezenmofenshen/kzgwzl/sv262capcgg9o8s5 ) #画图代码不报错,但不出图用dev.off解决 #关于breaks的进一步学习 #?
生信学习第四天之R语言生信学习第四天之R语言1R语言学习和了解1.1 之前就安装过R和Rstudio,浅学习过《r语言实战》,及基本的语言。后续可以再计划学习R for Data Science。 系统学习作图。 2.R语言作图2.1 利用R语言中自带的数据集进行作图学习plot(rnorm(50))#plot 绘制图形的函数;rnorm(50)随机产生正态分布的50个数boxplot(iris$Sepal.Length 3.R语言学学习思维导图图片
安装和加载R包1.镜像设置生信星球公众号:你还在每次配置Rstudio的下载镜像吗?
生信学习第二天1.登录服务器,下载安装好xshell7、xftp7等软件,根据账号密码和ip地址等信息正确远程登录服务器2.学习了解什么是linux系统及它的用处2.1 Linux系统下所有皆由“文件夹组成 用户分为管理员和一般用户,一般用户能到的最高级目录为宿主目录,放在home目录下3.学习了解Linux系统中最常见的几个基础命令图片4.实践操作图片
生信学习之第五天R语言实操1.R语言基本数据类型重点掌握向量和数据框,明确元素、向量、标量的定义元素:数字或者字符串(chr)标量:一个元素组成的变量向量:多个元素组成的变量图片2.提取元素2.1向量x
生信学习第三天1 生信软件的安装图片2 具体安装步骤2.1 百度搜索清华镜像下的安装链接=》进入:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda 复制代码后回车,注意理解代码意思conda list#开始使用condaconda install fastqc -yfastqc --help#确认是否安装成功3 实践操作图片4后续计划4.1 选修内容学习 4.2 linux系统详细视频学习
DAY1--生信学习前准备1学习方式,使用电脑进行学习,与小伙伴交流讨论,共同进步2解决问题,利用搜索引擎学会搜索,推荐虫快搜部落,去解决学习过程中的问题3提高效率的软件,浏览器推荐如chrome,电脑文件搜索 ,Windows用everything,Mac自带搜索;快捷截图软件snipaste或者电脑版微信;思维导图记录,推荐xmind,便于后期整理回顾学习4学习Markdown语法做笔记4.1展示代码a=14.2
一、学习小组正确打开方式 1.如何开启高效学习 每日学习完成后,与小伙伴一起学习讨论,并在腾讯云记录学习笔记。 2.如何解决学习中遇到的问题 (1)搜索引擎 首选-谷歌,其次-必应,另外推荐一个大神级的搜索引擎:虫部落快搜。 (2)专业教程(推荐) 搜狗微信、搜狗知乎、github 直接去搜网站名字,就能搜到 (3)正确的提问 礼貌提问,描述问题需要用截图(快捷截图软件用微信截图或snipaste) 学习小组课程范围内的问题课在微信群里问 ,学习小组范围外的问题邮件提问。 (4)电脑版微信功能使用 截图功能,文件传输助手。 2.学习流程 (1)思维导图 幕布:兼具大纲与思维导图两种模式。 xmind:仅有思维导图一种模式,简单易上手。
权限控制多用户的权限控制命令行模式linux的操作靠命令行来实现目录结构文件系统呈树状,宿主目录放在home目录下2.为什么学生信要用linux?
生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python Reference 一些练习题 给定FASTA
(library() : library(package)将加载名为package的命名空间,并添加到包的搜索列表中。加载前对搜索列表进行检查并更新,如果package不存在则报错,如果之前已加载package,则不会重复加载。如没有参数package即library(),则列出lib.loc指定的库中的所有可用包。library(help=package)将返回package的基本信息。
anaconda是总管,职务比conda低,但干的活不少,也是个有内涵的家伙miniconda是区域经理,说白了就是干事的,而且比较专一,主要负责生信领域二、如何下载软件1.创建biosoft(mkdir 从某链接下载软件:wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh生信星球 然后出现这个界面:3.下载完成后,运行 :bash Miniconda3-latest-Linux-x86_64.sh,然后开始安装过程4.激活:source ~/.bashrc(注意空格)生信星球:激活不成功就将 add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/conda config --set show_channel_urls yes生信星球三
今天的学习内容: 1.安装R(基础)和Rstudio(人性化一些的界面) 2.粗略了解R语言是什么,干什么的,认识Rstudio的工作界面 3.学会外观设置和基本操作 4.完成第一个R做的图 如果已经安装或者基础较好 ,可以看下R for Data Science的第一章,系统学习作图。 share_source=copy_web&vd_source=ba670d5a7ca081b044384f15866b88ef 注意:只看R和Rstudio的下载部分,剩下的非学习范围(不需要装R包) 百度网盘里的软件下载链接: 链接:https://pan.baidu.com/s/1YVf9lvI5jiK_7pPcdAQtvA 提取码:glgk 一.认识R和Rstudio R是一种编程语言,也是统计计算和绘图的环境 查看这一篇,养成好习惯: https://mp.weixin.qq.com/s/G-LXN9P2HVLv9v0cvyFJMA 2.显示文件列表 直接打命令不跟路径会显示哪里?
R包是多个函数的集合,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。
提取某两列作散点图:plot(iris$Sepal.Length,iris$Sepal.Width)学习一下脚本的使用和保存:将上面的代码复制到一个新的R脚本中。
图片——来源:生信星球2.为什么学生信要用linux?(1)生物软件基于linux,系统开源、免费,不需要图形界面,有效节约资源。(2)命令行模式可以批量、高效地处理文件,满足数据分析的要求。 同时安装Xftp如何登录生信星球https://www.jianshu.com/p/8a340b103a411.ip地址。ip是代表服务器的一个“编号”。2.用户名。bio开头的那个3.密码。
视为一个整体,一个向量只能有一种数据类型,可以有重复值)数据框(约等于表格,一列只能有一种数据类型)矩阵列表4.1 向量的生成c(2,3,15,5,7)## [1] 2 3 15 5 7c(1:9) ## [1] 1 2 3 4 5 6 7 8 9rep("x",times=3)## [1] "x" "x" "x"##有重复的用rep(),有规律的序列用seq(),随机数用rnorm()seq(from =3,to=21,by=3)## [1] 3 6 9 12 15 18 21paste0(rep("x",times=3),1:3)## [1] "x1" "x2" "x3"###paste0函数是把数据连在一起
Day1 学习生信准备1. 搜索引擎推荐1.1 浏览器搜索引擎:谷歌,必应,虫部落快搜1.2 专业教程搜索:搜狗微信、搜狗知乎、github2. 学习软件推荐2.1 浏览器:chrome,可以安装一些插件2.2 电脑文件搜索:Everything2.3 截图软件:snipaste,微信3. 学习方式:做思维导读,推荐使用幕布,xmind4. 学习markdown语法做笔记常见格式如下:1.展示代码a = 1 注意 :这里要设置代码格式,否则会报错。 我们的学习小组教程是非开放的,你的笔记应当是经过你自己消化和整理的,禁止直接复制、抄袭发布。
后起之秀奔涌而至,欢迎大家在《生信技能树》的舞台分享自己的心得体会! 下面是优秀学徒的稿件 Jimmy老师去年解析了CIBERSORT使用SVM算法实现去卷积,我决定亦步亦趋的跟着Jimmy老师的代码学习 背景知识 首先有一些背景知识需要了解(特别是一些算法),但是我的理解方法特别粗暴 ssGSEA GSEA分析,jimmy老师在《生信技能树》公众号多次讲解: GSEA分析一文就够(单机版+R语言版) GSEA的统计学原理试讲 GSVA或者GSEA各种算法都是可以自定义基因集的 但实际上 cells CD4 naive" # [7] "T cells CD4 memory resting" "T cells CD4 memory activated" # [9] 8),col=mypalette_1,xlab="Greens (sequential)", ylab="",xaxt="n",yaxt="n",bty="n") set1里面配色最多9种