首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信宝典

    分析Python实战练习 2 | 视频20

    开源 Python教程 专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 一些练习题 给定 FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分) open(file) for .. in loop print() strip ......TCCGCTG......GCGTTCACC......CGGGGTCCGGAG 写程序 formatFasta-2.py, 读入test2.fa,把每条FASTA序列分割成80个字母一行的序列 (2分) sort dict aDict[key] = [] aDict[key].append(value) 用到的知识点 提取给定名字的序列 (2分) 用到的知识点 print >>fh, or fh.write() 取模运算,4 % 2 == 0 写程序 grepFasta.py, 提取fasta.name中名字对应的test2.fa的序列,并输出到屏幕。

    20620编辑于 2023-08-30
  • 来自专栏生信宝典

    分析Python实战练习 2 | 视频19

    开源 Python教程 专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 一些练习题 给定 FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分) open(file) for .. in loop print() strip ......TCCGCTG......GCGTTCACC......CGGGGTCCGGAG 写程序 formatFasta-2.py, 读入test2.fa,把每条FASTA序列分割成80个字母一行的序列 (2分) sort dict aDict[key] = [] aDict[key].append(value) 用到的知识点 提取给定名字的序列 (2分) 用到的知识点 print >>fh, or fh.write() 取模运算,4 % 2 == 0 写程序 grepFasta.py, 提取fasta.name中名字对应的test2.fa的序列,并输出到屏幕。

    25340编辑于 2023-08-30
  • 来自专栏芒果先生聊生信

    分析网站(生存分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 差异分析,无论是Oncomine,GEPIA,还是UALCAN、HPA数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 fold change>2(起码1.5),p<0.05是差异分析的基本标准。但是表达的差异≠表型的差异,而这两者关系又密不可分。 生存分析论文中经常出现的表型,也就是说基因在正常和肿瘤组织中表达的差异,与生存率的指标密切相关。如A基因在肿瘤中表达明显上调,生存率显著下降,这就是非常明确的相关性。 生存分析是非常重要的表型,诸多文章均有介绍。这里,我们对生存分析的纯数据库进行总结,果友们在选择时也可以作为参考。

    4.4K44发布于 2020-08-11
  • 星球--学习DAY2:适应Linux

    1.什么是linux,什么是服务器?linux与windows、mac同属于操作系统。应用场景supercomputer(服务器),优点在于支持多用户同时使用,且互不干扰。 权限控制多用户的权限控制命令行模式linux的操作靠命令行来实现目录结构文件系统呈树状,宿主目录放在home目录下2.为什么学生要用linux? 生物软件基于linux,系统开源、免费,不需要图形界面,有效节约资源.3.怎样召唤linux--阿里云服务器1 单纯linux2 Windows10上的linux3 Windows7 上的linux4 Mac上的linux5 本地服务器上的linux6 云服务器上的linux相较于windows,mac在此方面有天然优势。 4.怎样登录服务器--xshell和terminal恰好手头有台macbookmacbook,terminal启动!5.linux有哪些最基本的操作?

    46300编辑于 2024-01-19
  • 来自专栏芒果先生聊生信

    分析网站(免疫浸润分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。 生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 免疫浸润分析比生存分析、差异分析和相关性分析难度更大,因为免疫学是不断延伸、拓展的学科,并不断从理论走向应用、临床,兼有科学性和技术性,比如实验中已经普遍应用的免疫印迹(WB),流式分析,免疫组化和免疫荧光等等 分析中,有一种算法叫反卷积分析,英文名叫Deconvolution。 开发人员可以先通过预设一个优秀的数据训练集(训练集主要包含了每种不同免疫细胞的基因表达特征),然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。

    7.7K43发布于 2020-08-12
  • 来自专栏生信菜鸟团

    分析中linux的使用2-文件管理

    技能树学习笔记 Linux里的文件 1.文件的传输 2.文件的表示 文件夹管理或路径有关的符号: . 当前目录 .. cp:copy and paste 常见参数:-r, copy directories recursively 常见用法:cp [OPTION] SOURCE DIRECTORY 要说明:1.拷贝谁2. tar归档文件(创建压缩文件) -x ## 从已有tar归档文件中提取文件(解压缩) -f ## 输出结果到文件或设备 -v ## 在处理文件时显示文件(显示处理进度) -j ## 将输出重定向给bzip2命令 Linux 中很多压缩程序只能针对一个文件进行压缩,这样当你想要压缩 一大堆文件时,你得先将这一大堆文件先打成一个包(tar命令),然后 再用压缩程序进行压缩(gzip、bzip2或zip命令)。 http://linux.51yip.com/ linux命令手册 Q2:有没有什么书籍可以系统地学习linux相关的知识?

    31710编辑于 2024-07-10
  • 来自专栏生信课程note+实验知识

    课程note-2

    seq(from = 2,to = 15,by = 2) ## [1] 2 4 6 8 10 12 14 # 2.生成向量,内容为:"student2" "student4" "student6 seq(2,100,2) ## [1] 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 "AC104581.1" "MPP2" "ATP2A2" "SNRPE" ## [19] "PRSS8" "ZNF461" "CECR5" "LCP1" ## [43] "OR2D3" "LIPE" "LIPE" "CANX" "ATP6V1B2" "MARC2" z = rnorm(n=10,mean=0,sd=18) z[z<(-2)] ## [1] -4.657298 -8.565170 -18.576409 -2.250447 引自生技能树 This

    52120编辑于 2023-02-06
  • 来自专栏用户10800790的专栏

    星球 day 2 —— 橙子🍊

    服务于supercomputer的OS② 开源,能方便运行大量数据2、常用linux代码pwd #显示当前路径mkdir … #创建空目录ls #显示列表rm … #删除文件rmdir head … #显示前10行tail … #显示后10行head -n3 … #显示前3行|3可替换tail -n3 … #显示后3行cp file1 file2 #复制file1,命名file2mv #移动或重命名图片星球学习小组

    25380编辑于 2023-10-22
  • 来自专栏生信学习小组

    学习day2

    1.什么是linux,什么是服务器? 图片——来源:星球2.为什么学生要用linux?(1)生物软件基于linux,系统开源、免费,不需要图形界面,有效节约资源。(2)命令行模式可以批量、高效地处理文件,满足数据分析的要求。 3.怎样召唤linux--阿里云服务器(1)单纯linux,用U盘安装一下纯linux系统,推荐CentOS或者Ubuntu整个过程大概只需要20分钟;(2)Windows10上的linux(3)本地服务器上的 Unix/Linux 服务器。 同时安装Xftp如何登录星球https://www.jianshu.com/p/8a340b103a411.ip地址。ip是代表服务器的一个“编号”。2.用户名。bio开头的那个3.密码。

    33710编辑于 2024-01-17
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式分析系统开发 - 5 分析流程服务器端运行

    在上文图形化开放式分析系统开发 - 4 分析流程的图形化设计 讨论了分析pipeline的图形化,如何用图形的方式显示pipeline,但是pipeline脚本按照变量的形式保存之后,如何运行 本地模式: 优势:容易实现,运行效率高,不依赖网络 劣势:限制了软件的适用范围,本机性能就决定了分析性能,不易扩展,限于运算量较低的业务。 2. 远程模式: 优势:便于扩展,部署方便。 分析过程状态、服务器运行状态,需要由服务器端推送到用户端。 服务器信息2.png 针对分析流程,按照约定定义了两个变量:${data}数据输入目录,${result}输出目录 考虑到并行运算,这里设置了该账户可以并行运行的任务数量,已经连续运行任务的最小时间间隔 运行完成后服务器端推送信息到控制端,判断是否符合要求,输出文件是否存在 运行失败后服务器端推送信息到控制端,显示错误信息,错误日志,便于开发人员查找错误 统计每一个分析步骤的运行时间,便于统计分析

    95500发布于 2020-01-17
  • 来自专栏Chris生命科学小站五年归档

    2元小时的分析服务器的建立、配置与操作攻略~

    操作步骤 建立一台云服务器 登陆https://cloud.tencent.com注册一个账号登陆这个账号充个值20元。 具体操作如下1、 2、 3、 4、 5、 6、 7、 8、 这样你就有一台自己的服务器了 尝试与服务器第一次牵手 打开终端 输入ssh -q -l root -p 22 xxx.xxx.xxx.xxx 这里的xxx是服务器公网IP,下图中找到。 详细如下:一般PE150的数据压缩以后最多8G,上传的速度1M/s,所用时间为2小时,低配置1元/小时,一共需要2元钱。 然后做完一次项目云服务器点销毁,一定要点销毁,关机的话还会计费的,我被坑过,后来联系客服才知道。

    1.8K10编辑于 2023-02-28
  • 来自专栏芒果先生聊生信

    分析网站(欢迎收藏)

    分析,无论是Oncomine,GEPIA,还是KM Plotter数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 p<0.05就是我们前期做分析想要的结果,即使用GEO数据库、TCGA数据库做分析,甚至做芯片或测序,没有差异也是枉然。 对于医生,个人建议是最好学会R语言,最起码掌握不用R语言的数据库分析。 最重要的是阅读过的文献和做过的分析,可以进一步促进对临床上疾病的认识,提升医生的诊治水平。 ? 接下来,我们将按照中心法则和论文分析的思路总结分析的网站。 这些网站均是纯数据库,不需要R语言基础,就像Excel、PPT一样容易上手,只要你愿意学,肯定能学会。 差异分析数据库 oncomine数据库(差异分析首选) https://www.oncomine.org/resource/main.html GEPIA数据库(共表达是特色) http://gepia.cancer-pku.cn

    3.1K20发布于 2020-08-10
  • 来自专栏生信菜鸟团

    分析之conda安装

    技能树学习笔记 Anaconda 的官网是 https://www.anaconda.com/ 官网上介绍anaconda是所有语言的包、依赖和环境管理器。 Conda之间的关系如下 当我们使用服务分析数据,我们使用miniconda,如果在自己的电脑上使用anaconda。 因为在数据分析过程中我们要使用很多种软件,软件安装中会遇到各种问题。 添加镜像要看服务器所在的位置,不是使用者所在的位置 第三步——创建独立小环境 为什么要创建独立的环境? conda remove -n rna fastqc 不指定-n参数就得进入该环境之后才能进行删除操作,同样,-y能够跳过确认执行的步骤 Conda常用命令 补充 技能树学习笔记 前情提要:1.安装

    1.2K10编辑于 2024-07-10
  • 来自专栏芒果先生聊生信

    分析网站(相关性分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 严谨的论文还对分析结果做出ROC曲线,以提高数据的可信度和说服力。 ) http://www.oncolnc.org/ cBioPortal(组学分析神器也能做生存分析) https://www.cbioportal.org/ 差异分析数据库 oncomine数据库(差异分析首选

    5.5K21发布于 2020-08-11
  • 来自专栏生信技能树

    第一步-购买腾讯云服务器搭建自己的分析环境

    一.腾讯云服务器-构建分析环境 01.硬盘设置 挂载数据盘,我先买了200G的云数据盘,暂时够用,手动挂载后,需要进入服务器,再次进行挂载 df -h # 服务器原始的状态 ? 这里要特别感谢技能树群里的小伙伴,jimmy、skk、李东野、黯蓝、卖萌哥、小洁,在他们的热心帮助下,解决了这个问题!万分感谢!问题出在腾讯云的安全组设置! ? ? ? ? rstudio ? ♚ OK,到这里,配置就完成了!前前后后、反反复复,配置一个云服务器,花了3天的时间,设置自动挂载、寻找源,一个个的解决问题,这还是在有优质的教学视频的前提下,假如没有,学习成本还要高得多。 这里,真的要大力推荐 技能树团队 的教程, 感谢jimmy等一批无私分享者!对于我们这样的小白,实在是务必珍贵的资源,希望更多人能够看到,并从中学习到想要的技能、知识! 参考: 技能树公众号 - 所有的教程都值得仔仔细细的学习 R官网教程 https://cran.r-project.org/bin/linux/ubuntu/README.html#secure-apt

    4.7K22发布于 2020-04-02
  • 来自专栏生信课程note+实验知识

    技能树-R作业-2

    title=sample$Titletitle## [1] "SS2_15_0048_A1" "SS2_15_0048_A2" "SS2_15_0048_A3" "SS2_15_0048_A4 25] "SS2_15_0048_B1" "SS2_15_0048_B2" "SS2_15_0048_B3" "SS2_15_0048_B4" ## [29] "SS2_15_0048_B5" "SS2_15_0048_B6" "SS2_15_0048_B7" "SS2_15_0048_B8" ## [33] "SS2_15_0048_B9" "SS2_15_0048_B10" "SS2 _0048_C2" "SS2_15_0048_C3" "SS2_15_0048_C4" ## [53] "SS2_15_0048_C5" "SS2_15_0048_C6" "SS2_15_0048 SS2_15_0048_N23" "SS2_15_0048_N24"## [337] "SS2_15_0048_O1" "SS2_15_0048_O2" "SS2_15_0048_O3" "SS2

    72750编辑于 2023-05-19
  • 来自专栏我的生信入门

    入门DAY2—分野

    Linux服务器 Linux登录的方法 下载xshell,相当于服务器终端。 : 复制 cp 原文件名字+新命名文件名 cp hi.txt hihi.txt 图片 mv: 给文件重命名或者移动文件路径 mv hi.txt 路径 意思是移动hi文件到某路径下 mv hi1 hi2 意思是给hi1重命名为hi2 图片

    40570编辑于 2023-09-21
  • 来自专栏笔记生信

    提升day2-婷

    好像只要谈到linux,必会和服务器挂钩,服务器,云服务器,扩展机....是不是可以理解为电脑只是用linux这个操作系统的载体,而不像微软的电脑用windows,苹果用mac,所以Linux需要一个服务器来载起它 ,不需要专门的电脑和它匹配,这个服务器就像配备精良的高端电脑 登录 登录成功了,但是没有理解1-9的练习内容 代码引用星球 疑问 有的练习成功,有的失败,说明还是没搞懂,再试试看看 思维导图 别的问题不大 就是从第四以后就感觉很奇怪,老师说的和我有运行的是两个东西 练习后的截图,有不对的请指正 1.print working directory(pwd),显示当前路径 /home/bio07 是我的当前路径 2. 而不需要每次都用ls查看 6.7芜湖~有趣 8:使用:cp file1 file2 ,复制file1,命名为file2的意思。 9.每个命令中间都要打空格吗,不打是不是就报错?

    34920编辑于 2023-11-15
  • 来自专栏科研菌

    代码:差异分析(TCGAbiolinks包)

    此外,还会顺带讲两个进行富集分析和聚类分析的函数。 <- dataFilt_LIHC_final[,341-390] mat2 <- log(mat2+1) # 然后就可以进行差异表达分析啦! 此参数不用设置 contrast.formula 自主设置系数和对比度 Condtypes MAT中的样本分组 富集分析 02 # 设置logFC,挑选表达有差异的基因进行富集分析 Data_DEGs_high_expr )":22列 xlim X轴的范围 color 每个条形图的颜色,默认:c("orange", "cyan","green","yellow") 聚类分析 02 res.hc <- TCGAanalyze_Clustering ) # 聚类分析结果: ?

    3.2K42发布于 2021-01-12
  • 入门——Day1-2

    Day1引自生技能树一、R与Rstudio1、什么是R编程语言;环境2、什么是Rstuio集成开发环境3、如何在Rstuio中新建项目project引自生技能树4、新建脚本script引自生技能树 5、Rstuio介绍引自生技能树6、面板显示和字号设置引自生技能树引自生技能树7、与R语言交互(1)控制台窗口(2)脚本编辑器(逐行运行ctrl+enter;选中运行ctrl+A)(3)使用“#” ,忽略# 练习2-2# 1.生成1到15之间所有偶数,并用代码查看a的内容a = seq(from = __,to = __,by =__)a#答案:2,14,2# 2.生成向量,内容为:"student22)数学计算(3)连接(4)交集、并集、差集引自生技能树引自生技能树老师提问:若两边的y各增加一个元素2,那么两边产生的逻辑值的个数分别为5和4。 4、向量取子集(1)按照逻辑值取(2)按照位置取引自生技能树#####2.4.向量筛选(取子集)--看ppt#####x <- 8:12#根据逻辑值取子集x[x == 10]x[x < 12]x[x

    52810编辑于 2025-05-11
领券