搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏生信宝典
生信分析Python实战练习 9 | 视频27
生信专用简明 Python 文字和视频教程源码在：https://github.com/Tong-Chen/Bioinfo_course_python Reference 一些练习题给定FASTA
28741编辑于 2023-09-22
来自专栏免疫组库研究
【生信分析】免疫组库基础分析9-CDR3 motif分析
通过分析 CDR3 motif 的序列特征（如长度、关键氨基酸残基），可阐明免疫受体（Ig/TCR）与抗原结合的分子规律，揭示 “抗原 - 受体” 相互作用的特异性机制，为理解免疫应答的精准调控提供依据图1.不同长度的CDR3 氨基酸motif比较 2.2 CDR3 中间氨基酸motif 分析这是一种忽略CDR3长度，关注CDR3中间氨基酸多样性motif分析策略。图2.CDR3中间氨基酸motif 分析 3. 举例分析CDR3motif 3.1 展示特定长度CDR3 氨基酸motif library(tidyr) library(tidyverse) files <-list.files(path = ". page_grobs) + 1]] <- combined_plot } # 将所有页面组合成一个 PDF 文件 pdf(paste0(condition_name,".png"), width = 9,
27110编辑于 2025-10-20
生信入门DAY7-9
本篇内容引自生信技能树 DAY7-9 课前提问： 1、为什么要做数据挖掘？即用别人的数据用在自己的文章里面，多半是从别人的数据里筛选自己想要的基因。拿到表达矩阵之前的分析叫上游分析，之后的叫下游分析。 5、筛选基因的分析方法（基因芯片和转录组通用）差异分析：测定基因表达量的原理不同，前者是光信号值，后者是短序列的条数。富集分析：用统计学方法找出筛选出来的这些基因的共同点，功能分类有什么相同之处。 PPI网络：从大量的文献中发掘了一些信息，即基因之间的互作关系。 step2output.Rdata") #比较复杂的探针注释参考资料 #资料1：拆分取列https://www.yuque.com/xiaojiewanglezenmofenshen/kzgwzl/sv262capcgg9o8s5 toptable,这个表格就是我们差异分析的结果，inf是正无穷，有多少行显示多少行。
52310编辑于 2025-05-22
生信技能树Day9 GEO数据挖掘差异分析
差异分析表格二分组数据差异分析#差异分析 limmalibrary(limma)design = model.matrix(~Group) # 生成模型矩阵fit = lmFit(exp,design) ,]rownames(exp3) = ids$symbolexp3[1:4,1:4]exp4 = limma::avereps(exp3)# 此时拿到的exp4已经是一个基因为行名的表达矩阵，直接差异分析 4.加ENTREZID列，用于富集分析（symbol转entrezid，然后inner_join）library(clusterProfiler)library(org.Hs.eg.db)s2e = bitr nrow(deg)save(exp,Group,deg,logFC_t,p_t,file = "step4output.Rdata")富集分析# 准备工作rm(list = ls()) load(file clusterProfiler-book/index.html# GOplot：https://mp.weixin.qq.com/s/LonwdDhDn8iFUfxqSJ2Wew# 网上的资料和宝藏无穷无尽，学好R语言慢慢发掘~生信技能树
70611编辑于 2024-04-21
来自专栏芒果先生聊生信
生信分析网站（生存分析）
生信论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析；临床标本从蛋白水平确认（或HPA数据库），很重要； Kaplan-Meier Plotter从临床意义的角度阐明其重要性； cBio-portal 数据库做基因组学的分析（机制一）； STRING互作和GO/KEGG分析探讨可能的信号通路（机制二）； TISIDB/TIMER分析肿瘤免疫特征（机制三）。差异分析，无论是Oncomine，GEPIA，还是UALCAN、HPA数据库，都不需要R语言编写代码，容易上手，基本上一个星期甚至更短的时间就可以搞定，属于菜鸟级别生信操作。并没有想象中那么难。生存分析是生信论文中经常出现的表型，也就是说基因在正常和肿瘤组织中表达的差异，与生存率的指标密切相关。如A基因在肿瘤中表达明显上调，生存率显著下降，这就是非常明确的相关性。生存分析是非常重要的表型，诸多文章均有介绍。这里，我们对生存分析的纯生信数据库进行总结，果友们在选择时也可以作为参考。
4.4K44发布于 2020-08-11
来自专栏生信小驿站
R语言之生信（9）R语言多个生存分析曲线比较
参数data：一个数据框，用于做生存分析的数据。参数p.adjust.method：p值矫正方法（参见p.adjust）。 0.062 0.485 0.527 P value adjustment method: BH 通过这个矩阵我们可以看到molecular_group 水平上两两之间的生存分析对比的
6.2K30发布于 2019-03-22
来自专栏芒果先生聊生信
生信分析网站（免疫浸润分析）
生信论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析；临床标本从蛋白水平确认（或HPA数据库），很重要； Kaplan-Meier Plotter从临床意义的角度阐明其重要性； cBio-portal 在差异分析的前提下，表型分析成为重点内容，也是可以玩出花样的地方。生存分析是非常常见的表型分析。与生存分析相比，相关性分析是另外一个常见的表型分析。免疫浸润分析比生存分析、差异分析和相关性分析难度更大，因为免疫学是不断延伸、拓展的学科，并不断从理论走向应用、临床，兼有科学性和技术性，比如实验中已经普遍应用的免疫印迹（WB），流式分析，免疫组化和免疫荧光等等生信分析中，有一种算法叫反卷积分析，英文名叫Deconvolution。生信开发人员可以先通过预设一个优秀的数据训练集（训练集主要包含了每种不同免疫细胞的基因表达特征），然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。
7.7K43发布于 2020-08-12
来自专栏生信马拉松
生信马拉松 Day9-10 GEO数据分析笔记
贴具体的代码好像挺重复的，只贴一些过去自学没有了解到的有趣的TIPS： 1、转录组数据不能直接套芯片的流程，错套的第一个表现就是dim结果是行为0 2、non-coding和普通array可以统一处理，但不能做富集分析，富集分析需要用编码蛋白做，或者先靶基因预测然后再做富集分析 3、normalize不是一定要加，不normalize会相对不够整齐，成钉子形状的往往是没取log 不会因为千八百异常表达的使整体数据发生明显差别里的第二栏里，带“--”说明不对应任何symbol，需要删去 7、一个探针对应多个基因（非特异性探针），难以解释，这些行直接去掉 8、对于lnkRNA不能直接用页面上的TargetID，尽量寻找symbol列 9、 ="";table(k2) ids = b[k1&k2,] 16、筛选下载数据中的部分样本进行数据分析 library(stringr) # 方法1：按照行号，能数的时候可以自己数行号 keep = c str_detect(pd$title,"and");table(keep) exp = exp[,keep] pd = pd[keep,] 总结：小洁老师讲的真的非常好，细腻又形象，准备学生信的一定要来学一波让你丝滑入门
59900编辑于 2024-01-26
来自专栏图形化开放式生信分析系统开发
图形化开放式生信分析系统开发 - 5 生信分析流程服务器端运行
在上文图形化开放式生信分析系统开发 - 4 生信分析流程的图形化设计讨论了生信分析pipeline的图形化，如何用图形的方式显示生信pipeline，但是pipeline脚本按照变量的形式保存之后，如何运行分析过程状态、服务器运行状态，需要由服务器端推送到用户端。综合考虑，结合软件设计目标，这里选择远程模式运行服务器节点：服务器节点信息：经常手动分析脚本的朋友大家的习惯可能是，ssh远程登录Linux服务器，在shell控制台输入各种脚本，软件。服务器信息2.png 针对分析流程，按照约定定义了两个变量：${data}数据输入目录，${result}输出目录考虑到并行运算，这里设置了该账户可以并行运行的任务数量，已经连续运行任务的最小时间间隔运行完成后服务器端推送信息到控制端，判断是否符合要求，输出文件是否存在运行失败后服务器端推送信息到控制端，显示错误信息，错误日志，便于生信开发人员查找错误统计每一个分析步骤的运行时间，便于统计分析
95500发布于 2020-01-17
来自专栏芒果先生聊生信
生信分析网站（欢迎收藏）
生信分析，无论是Oncomine，GEPIA，还是KM Plotter数据库，都不需要R语言编写代码，容易上手，基本上一个星期甚至更短的时间就可以搞定，属于菜鸟级别生信操作。并没有想象中那么难。 p<0.05就是我们前期做分析想要的结果，即使用GEO数据库、TCGA数据库做分析，甚至做芯片或测序，没有差异也是枉然。对于医生，个人建议是最好学会R语言，最起码掌握不用R语言的数据库分析。最重要的是阅读过的文献和做过的生信分析，可以进一步促进对临床上疾病的认识，提升医生的诊治水平。 ? 接下来，我们将按照中心法则和生信论文分析的思路总结生信分析的网站。这些网站均是纯生信数据库，不需要R语言基础，就像Excel、PPT一样容易上手，只要你愿意学，肯定能学会。差异分析数据库 oncomine数据库（差异分析首选） https://www.oncomine.org/resource/main.html GEPIA数据库（共表达是特色） http://gepia.cancer-pku.cn
3.1K20发布于 2020-08-10
来自专栏生信菜鸟团
生信分析之conda安装
生信技能树学习笔记 Anaconda 的官网是 https://www.anaconda.com/ 官网上介绍anaconda是所有语言的包、依赖和环境管理器。 Conda之间的关系如下当我们使用服务器分析数据，我们使用miniconda，如果在自己的电脑上使用anaconda。因为在数据分析过程中我们要使用很多种软件，软件安装中会遇到各种问题。基因组、转录组、Chip-seq…… 具体步骤： # 创建名为rna的软件环境来安装转录组学分析的生物信息学软件 conda create -y -n rna python=3.7 这一步输入y或回车都可以 conda remove -n rna fastqc 不指定-n参数就得进入该环境之后才能进行删除操作，同样，-y能够跳过确认执行的步骤 Conda常用命令补充生信技能树学习笔记前情提要：1.安装
1.2K10编辑于 2024-07-10
来自专栏芒果先生聊生信
生信分析网站（相关性分析）
生信论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析；临床标本从蛋白水平确认（或HPA数据库），很重要； Kaplan-Meier Plotter从临床意义的角度阐明其重要性； cBio-portal 数据库做基因组学的分析（机制一）； STRING互作和GO/KEGG分析探讨可能的信号通路（机制二）； TISIDB/TIMER分析肿瘤免疫特征（机制三）。在差异分析的前提下，表型分析成为重点内容，也是可以玩出花样的地方。生存分析是非常常见的表型分析。与生存分析相比，相关性分析是另外一个常见的表型分析。严谨的生信论文还对分析结果做出ROC曲线，以提高数据的可信度和说服力。） http://www.oncolnc.org/ cBioPortal（组学分析神器也能做生存分析） https://www.cbioportal.org/ 差异分析数据库 oncomine数据库（差异分析首选
5.5K21发布于 2020-08-11
来自专栏生信技能树
生信第一步-购买腾讯云服务器搭建自己的生信分析环境
一.腾讯云服务器-构建生信分析环境 01.硬盘设置挂载数据盘，我先买了200G的云数据盘，暂时够用，手动挂载后，需要进入服务器，再次进行挂载 df -h # 服务器原始的状态 ? 这里要特别感谢生信技能树群里的小伙伴，jimmy、skk、李东野、黯蓝、卖萌哥、小洁，在他们的热心帮助下，解决了这个问题！万分感谢！问题出在腾讯云的安全组设置！ ? ? ? ? rstudio ? ♚ OK，到这里，生信配置就完成了！前前后后、反反复复，配置一个云服务器，花了3天的时间，设置自动挂载、寻找源，一个个的解决问题，这还是在有优质的教学视频的前提下，假如没有，学习成本还要高得多。这里，真的要大力推荐生信技能树团队的教程，感谢jimmy等一批无私分享者！对于我们这样的小白，实在是务必珍贵的资源，希望更多人能够看到，并从中学习到想要的技能、知识！参考：生信技能树公众号 - 所有的教程都值得仔仔细细的学习 R官网教程 https://cran.r-project.org/bin/linux/ubuntu/README.html#secure-apt
4.7K22发布于 2020-04-02
来自专栏科研菌
生信代码：差异分析（TCGAbiolinks包）
引言：上一期（这里可到达上一期）我们利用得到的肝癌的数据，进行了预处理，得到了最终的表达矩阵TCGA_LIHC_final.csv，今天我们的主要任务就是进行差异表达分析。此外，还会顺带讲两个进行富集分析和聚类分析的函数。基因差异表达分析 01 # 首先读入表达矩阵文件 dataFilt_LIHC_final <- read.csv("TCGA_LIHC_final.csv", header = T,check.names <- log(mat1+1) # 定义正常组织样本分组 mat2 <- dataFilt_LIHC_final[,341-390] mat2 <- log(mat2+1) # 然后就可以进行差异表达分析啦 Genelist) # 富集分析的结果 ?
3.2K42发布于 2021-01-12
来自专栏用户7627119的专栏
聊个天就把生信分析做了！！！
2020年9月24日看到美国MD安德森癌症研究中心梁晗老师实验室发表在Cencer Cell的Next-generation Analytics for Omics Data的评论文章，介绍了其团队基于自然语言和人工智能开发的组学数据分析平台这是一个很宏大的设想，不需要编程，只需要输入自然语言，该工具就可以帮助实现所需的分析。而且还可以根据每次的分析经历进行自我学习和提高，不断完善其识别任务和盛微信分析的能力。这么有意思的工具得实际体验一下，经测试可以轻松完成TCGA数据的统计、指定基因的关联分析和一套转录组数据的分析（从原始数据到表达矩阵）。其官方视频还提供了进行生存分析、突变分析等功能的演示。 1663759447&vid=wxv_1544970671129198595&format_id=10002&support_redirect=0&mmversion=false DrBioRight转录组分析 1663759446&vid=wxv_1544981306189643777&format_id=10002&support_redirect=0&mmversion=false DrBioRight生存分析
67620编辑于 2022-09-21
来自专栏天意生信俱乐部
CPU、内存、存储：生信分析任务的服务器配置精要
天意生信云我们是市面上唯一一家使用公有云（华为云、移动云、火山云）作为算力底座的生信共享云服务器厂商！生信初始化配置：默认搭载Rstudio（包含1000+常用包）及Jupyter，开箱即用。 ROOT权限：独享服务器、共享服务器拥有ROOT最高权限，可完全掌控服务器，随意安装软件。信任背书：政府基金投资单位：荣誉资质：国家级科技型中小企业、广东省创新型中小企业天意生信云产品天意云服务器产品类型包括集成分析环境、共享服务器、独享服务器三种。服务器配置科学划分，按需部署。 1、注册并登录：进入我们的天意生信云（https://bio.dftianyi.com），简单注册后即可登录。 2、选择算力套餐：“天意生信云”，然后根据你的项目需求，自由选择算力套餐，无论是小规模的测试分析还是大规模的基因组测序，都能满足。
1.8K10编辑于 2025-08-13
来自专栏图形化开放式生信分析系统开发
图形化开放式生信分析系统开发 - 3 生信分析流程的进化
接上两篇内容，本文主要讲述工作中NGS从科研进入医学临床领域，工作中接触到生信流程，以及最终在实现的过程。接触二代测序，生信分析，那真是打开了一个新世界的大门，各种名次术语满天飞，搞的头晕脑胀。下面分阶段描述生信分析流程升级/进化的过程： ---- 1.手动命令行运行经过几个月接触，自学、爬坑，慢慢搞清楚了部分内容，在似懂非懂之间开始了生信流程分析，终于有一天明白过来，这所谓的pipeline 比如其中一个步骤：生信分析流程的进化_1.png QC 完成后，然后运行下一个步骤：生信分析流程的进化_2.png 运行模式，一个输入或者多个输入文件，通过软件分析/计算得到一个或者多个输出文件脚本连续运行随着熟练程度提高，生信分析上用到的软件/工具也熟悉起来了，但是问题也暴露出来了，简单的一套 GATK Best Practice 肿瘤突变分析流程，加上CNV，SV 分析从 fastq 文件开始到最后得到过滤的到这里，基本上就达到很多公司的生信自动化分析水平了 6. 然而到这里就足够了么?
1.2K00发布于 2020-01-17
来自专栏芒果先生聊生信
生信分析网站（基因组学分析）
生信论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析；临床标本从蛋白水平确认（或HPA数据库），很重要； Kaplan-Meier Plotter从临床意义的角度阐明其重要性； cBio-portal 数据库做基因组学的分析（机制一）； STRING互作和GO/KEGG分析探讨可能的信号通路（机制二）； TISIDB/TIMER分析肿瘤免疫特征（机制三）。根据我们的整理，差异分析是基础，生存分析和相关性分析是表型，免疫浸润分析是对表型的阐释，兼有表型和机制两种作用，但并不是真正意义上的机制探究。 / MethSurv（同时做甲基化分析和生存分析） https://biit.cs.ut.ee/methsurv/ SMART（专门用于甲基化分析数的据库） http://www.bioinfo-zs.com ） http://www.oncolnc.org/ cBioPortal（组学分析神器也能做生存分析） https://www.cbioportal.org/ 差异分析数据库 oncomine数据库（差异分析首选
3.6K11发布于 2020-08-12
来自专栏科技记者
GPU加速生信分析--序列比对Arioc
最近偶尔探索下GPU生信软件，虽然方兴未艾，发现多数软件已经是古董，比如GPU版本的Blast，使用CUDA7，10.1这样的版本已经是最新的，软件依赖复杂，编译较难成功（亲测失败）。当然，服务器的软件版本一般是相对稳定的，可能用起来问题也不大。 BIOLOGY发表了使用多GPU分析的成果。展望相信随着大模型及Agent的发展，近期可以是生信分析员的agent可以解放许多烦索的工作，人更多地可以花时间进行监督已有流程的运行，错误的改正。远期是类似AutoBA的全自动生信agent，自动流程构建和数据分析。当然不排除可以部分流程的一步到位，或许未来一段时间还是人和AI相互配合解决具体问题。
51910编辑于 2024-12-23
来自专栏图形化开放式生信分析系统开发
使用docker完成生信分析环境搭建
生信开发人员最头疼的问题，可能就是平台搭建和软件安装了。部署和迁移上要费很大力气。本文讲述使用docker制作一个镜像，后续通过导入自己定制的镜像，复制文件完成分析流程的部署和迁移。 data目录，保存待分析的文件。在docker里面挂载目录为：/opt/data result目录，保存分析中间文件和最终结果文件。 uname -s`-`uname -m` -o /usr/local/bin/docker-compose sudo chmod +x /usr/local/bin/docker-compose 9. root@b8080a125313:/# # 为了我们后面使用该容器来运行分析流程，我们需要先安装ssh-server ssh服务 root@b8080a125313:/# apt-get 就可以在docker环境支持下快速完成生信分析环境的部署与迁移。七、官方推荐使用docker-file来描述docker镜像创建过程，这里过程太过繁琐，就不继续折腾了。有兴趣的可以继续改进
2.1K00发布于 2020-01-17

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

生信分析Python实战练习 9 | 视频27

【生信分析】免疫组库基础分析9-CDR3 motif分析

生信入门DAY7-9

生信技能树Day9 GEO数据挖掘差异分析

生信分析网站（生存分析）

R语言之生信（9）R语言多个生存分析曲线比较

生信分析网站（免疫浸润分析）

生信马拉松 Day9-10 GEO数据分析笔记

图形化开放式生信分析系统开发 - 5 生信分析流程服务器端运行

生信分析网站（欢迎收藏）

生信分析之conda安装

生信分析网站（相关性分析）

生信第一步-购买腾讯云服务器搭建自己的生信分析环境

生信代码：差异分析（TCGAbiolinks包）

聊个天就把生信分析做了！！！

CPU、内存、存储：生信分析任务的服务器配置精要

图形化开放式生信分析系统开发 - 3 生信分析流程的进化

生信分析网站（基因组学分析）

GPU加速生信分析--序列比对Arioc

使用docker完成生信分析环境搭建

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

生信分析Python实战练习 9 | 视频27

【生信分析】免疫组库基础分析9-CDR3 motif分析

生信入门DAY7-9

生信技能树Day9 GEO数据挖掘 差异分析

生信分析网站（生存分析）

R语言之生信（9）R语言多个生存分析曲线比较

生信分析网站（免疫浸润分析）

生信马拉松 Day9-10 GEO数据分析笔记

图形化开放式生信分析系统开发 - 5 生信分析流程服务器端运行

生信分析网站（欢迎收藏）

生信分析之conda安装

生信分析网站（相关性分析）

生信第一步-购买腾讯云服务器搭建自己的生信分析环境

生信代码：差异分析（TCGAbiolinks包）

聊个天就把生信分析做了！！！

CPU、内存、存储：生信分析任务的服务器配置精要

图形化开放式生信分析系统开发 - 3 生信分析流程的进化

生信分析网站（基因组学分析）

GPU加速生信分析--序列比对Arioc

使用docker完成生信分析环境搭建

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

生信技能树Day9 GEO数据挖掘差异分析