首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信宝典

    分析Python实战练习 10 | 视频28

    (10分) find 用到的知识点 输出格式 (输出格式为bed格式,第一列为匹配到的染色体,第二列和第三列为匹配到染色体序列的起始终止位置(位置标记以0为起始,代表第一个位置;终止位置不包含在内,第一个例子中所示序列的位置是

    30510编辑于 2023-09-27
  • 来自专栏芒果先生聊生信

    分析网站(生存分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 差异分析,无论是Oncomine,GEPIA,还是UALCAN、HPA数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 生存分析论文中经常出现的表型,也就是说基因在正常和肿瘤组织中表达的差异,与生存率的指标密切相关。如A基因在肿瘤中表达明显上调,生存率显著下降,这就是非常明确的相关性。 生存分析是非常重要的表型,诸多文章均有介绍。这里,我们对生存分析的纯数据库进行总结,果友们在选择时也可以作为参考。

    4.4K44发布于 2020-08-11
  • 来自专栏芒果先生聊生信

    分析网站(免疫浸润分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。 生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 免疫浸润分析比生存分析、差异分析和相关性分析难度更大,因为免疫学是不断延伸、拓展的学科,并不断从理论走向应用、临床,兼有科学性和技术性,比如实验中已经普遍应用的免疫印迹(WB),流式分析,免疫组化和免疫荧光等等 分析中,有一种算法叫反卷积分析,英文名叫Deconvolution。 开发人员可以先通过预设一个优秀的数据训练集(训练集主要包含了每种不同免疫细胞的基因表达特征),然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。

    7.7K43发布于 2020-08-12
  • 来自专栏芒果先生聊生信

    分析网站(欢迎收藏)

    分析,无论是Oncomine,GEPIA,还是KM Plotter数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 p<0.05就是我们前期做分析想要的结果,即使用GEO数据库、TCGA数据库做分析,甚至做芯片或测序,没有差异也是枉然。 对于医生,个人建议是最好学会R语言,最起码掌握不用R语言的数据库分析。 最重要的是阅读过的文献和做过的分析,可以进一步促进对临床上疾病的认识,提升医生的诊治水平。 ? 接下来,我们将按照中心法则和论文分析的思路总结分析的网站。 这些网站均是纯数据库,不需要R语言基础,就像Excel、PPT一样容易上手,只要你愿意学,肯定能学会。 差异分析数据库 oncomine数据库(差异分析首选) https://www.oncomine.org/resource/main.html GEPIA数据库(共表达是特色) http://gepia.cancer-pku.cn

    3.1K20发布于 2020-08-10
  • 来自专栏生信菜鸟团

    分析之conda安装

    技能树学习笔记 Anaconda 的官网是 https://www.anaconda.com/ 官网上介绍anaconda是所有语言的包、依赖和环境管理器。 Conda之间的关系如下 当我们使用服务器分析数据,我们使用miniconda,如果在自己的电脑上使用anaconda。 因为在数据分析过程中我们要使用很多种软件,软件安装中会遇到各种问题。 基因组、转录组、Chip-seq…… 具体步骤: # 创建名为rna的软件环境来安装转录组学分析的生物信息学软件 conda create -y -n rna python=3.7 这一步输入y或回车都可以 conda remove -n rna fastqc 不指定-n参数就得进入该环境之后才能进行删除操作,同样,-y能够跳过确认执行的步骤 Conda常用命令 补充 技能树学习笔记 前情提要:1.安装

    1.2K10编辑于 2024-07-10
  • 来自专栏芒果先生聊生信

    分析网站(相关性分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 严谨的论文还对分析结果做出ROC曲线,以提高数据的可信度和说服力。 ) http://www.oncolnc.org/ cBioPortal(组学分析神器也能做生存分析) https://www.cbioportal.org/ 差异分析数据库 oncomine数据库(差异分析首选

    5.5K21发布于 2020-08-11
  • 来自专栏生信马拉松

    马拉松 Day9-10 GEO数据分析笔记

    贴具体的代码好像挺重复的,只贴一些过去自学没有了解到的有趣的TIPS: 1、转录组数据不能直接套芯片的流程,错套的第一个表现就是dim结果是 行 为0 2、non-coding和普通array可以统一处理,但不能做富集分析 ,富集分析需要用编码蛋白做,或者先靶基因预测然后再做富集分析 3、normalize不是一定要加,不normalize会相对不够整齐,成钉子形状的往往是没取log 不会因为千八百异常表达的使整体数据发生明显差别 一个探针对应多个基因(非特异性探针),难以解释,这些行直接去掉 8、对于lnkRNA不能直接用页面上的TargetID,尽量寻找symbol列 9、官网下载对应产品的注释表格:往往是付费的,不能看到 10 、不是所有GPL都能找到注释 11、为什么会有很多探针空白 探针设置的前瞻性,20年前的探针可以测到2年前的基因,以前设计的探针可以测到未来的基因 12、富集分析找不到校正p<0.05的通路的解决方法 str_detect(pd$title,"and");table(keep) exp = exp[,keep] pd = pd[keep,] 总结: 小洁老师讲的真的非常好,细腻又形象,准备学生的一定要来学一波让你丝滑入门

    59900编辑于 2024-01-26
  • 来自专栏科研菌

    代码:差异分析(TCGAbiolinks包)

    引言:上一期(这里可到达上一期)我们利用得到的肝癌的数据,进行了预处理,得到了最终的表达矩阵TCGA_LIHC_final.csv,今天我们的主要任务就是进行差异表达分析。 此外,还会顺带讲两个进行富集分析和聚类分析的函数。 Genelist) # 富集分析的结果 ? PathTab = ansEA$ResPat, nRGTab = Genelist, nBar = 10 函数的 Cellular Component (CC) 结果 PathTab TCGAanalyze_EAcomplete 函数的 Pathways EA 结果 nBar 显示的条形图直条的数量,默认是10

    3.2K42发布于 2021-01-12
  • 来自专栏用户7627119的专栏

    聊个天就把分析做了!!!

    安德森癌症研究中心梁晗老师实验室发表在Cencer Cell的Next-generation Analytics for Omics Data的评论文章,介绍了其团队基于自然语言和人工智能开发的组学数据分析平台 这是一个很宏大的设想,不需要编程,只需要输入自然语言,该工具就可以帮助实现所需的分析。而且还可以根据每次的分析经历进行自我学习和提高,不断完善其识别任务和盛微分析的能力。 这么有意思的工具得实际体验一下,经测试可以轻松完成TCGA数据的统计、指定基因的关联分析和一套转录组数据的分析(从原始数据到表达矩阵)。其官方视频还提供了进行生存分析、突变分析等功能的演示。 1663759447&vid=wxv_1544970671129198595&format_id=10002&support_redirect=0&mmversion=false DrBioRight转录组分析 1663759446&vid=wxv_1544981306189643777&format_id=10002&support_redirect=0&mmversion=false DrBioRight生存分析

    67620编辑于 2022-09-21
  • 来自专栏免疫组库研究

    分析】免疫组库基础分析10-CDR3 氨基酸理化性质分析

    1.工具:alakazam包 alakazam包括一套功能来分析Ig和TCR氨基酸序列的物理化学性质。特别是对CDR3氨基酸特性的分析。 如果只关注CDR3序列,我们指定参数trim=TRUE,这将在分析之前剥离第一个和最后一个密码子(保守残基)。使用label="cdr3"参数将前缀cdr3添加到输出列名中。

    21110编辑于 2025-10-20
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式分析系统开发 - 3 分析流程的进化

    接上两篇内容,本文主要讲述工作中NGS从科研进入医学临床领域,工作中接触到流程,以及最终在实现的过程。 接触二代测序,分析,那真是打开了一个新世界的大门,各种名次术语满天飞,搞的头晕脑胀。 下面分阶段描述分析流程升级/进化的过程: ---- 1.手动命令行运行 经过几个月接触,自学、爬坑,慢慢搞清楚了部分内容,在似懂非懂之间开始了流程分析,终于有一天明白过来,这所谓的pipeline 比如其中一个步骤: 分析流程的进化_1.png QC 完成后,然后运行下一个步骤: 分析流程的进化_2.png 运行模式,一个输入或者多个输入文件,通过软件分析/计算得到一个或者多个输出文件 脚本连续运行 随着熟练程度提高,分析上用到的软件/工具也熟悉起来了,但是问题也暴露出来了,简单的一套 GATK Best Practice 肿瘤突变分析流程,加上CNV,SV 分析从 fastq 文件开始到最后得到过滤的 到这里,基本上就达到很多公司的自动化分析水平了 6. 然而到这里就足够了么?

    1.2K00发布于 2020-01-17
  • 来自专栏数据处理小技能

    技能树 R习题 1-10

    《如何系统入门R语言》这一篇微信文章是2017年2月写的了,距离现在7年,语言生动有趣跟现在的风格还有点不一样,那时候曾老师竟然一个个回点评还用颜文字嘞,而且17年就自称老一辈的工程师(难道现在是木乃伊辈的工程师 <-seq(5,15,2)C<-1:5#求A和B的并集union(A,B)#[1] 1 2 3 4 5 6 7 8 9 10 11 13 15#求A和B的交集intersect(A,B 4.R语言入门学习路径+资源集(篇)资源博,适合纯新手入门5.R语言的最好资源,一个就够! 也是一篇资源汇总的文字,资源真的太多了6.厦门大学不再提供R语言镜像这一篇现在应该没有太多意义了7.用R语言写爬虫收集整理所有开放期刊影响因子及审稿时长一篇分析R可以如何分析杂志发文量的小内容8.KEGG 【好书分享】《R语言实战(第2版)》就是《R语言实战》10.技巧第3课-请你务必学好R语言这里的视频似乎看不了了,主要的内容和马拉松的课程基本相同生技能树

    28810编辑于 2024-06-03
  • 来自专栏芒果先生聊生信

    分析网站(基因组学分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 根据我们的整理,差异分析是基础,生存分析和相关性分析是表型,免疫浸润分析是对表型的阐释,兼有表型和机制两种作用,但并不是真正意义上的机制探究。 / MethSurv(同时做甲基化分析和生存分析) https://biit.cs.ut.ee/methsurv/ SMART(专门用于甲基化分析数的据库) http://www.bioinfo-zs.com ) http://www.oncolnc.org/ cBioPortal(组学分析神器也能做生存分析) https://www.cbioportal.org/ 差异分析数据库 oncomine数据库(差异分析首选

    3.6K11发布于 2020-08-12
  • 来自专栏科技记者

    GPU加速分析--序列比对Arioc

    最近偶尔探索下GPU软件,虽然方兴未艾,发现多数软件已经是古董,比如GPU版本的Blast,使用CUDA7,10.1这样的版本已经是最新的,软件依赖复杂,编译较难成功(亲测失败)。 BIOLOGY发表了使用多GPU分析的成果。 # 测试下来需要的显存应该是在10G+的,否则会报错,感谢师兄友情赞助的显卡 # 下载示例数据 wget https://github.com/RWilton/Arioc/releases/download 展望 相信随着大模型及Agent的发展,近期可以是分析员的agent可以解放许多烦索的工作,人更多地可以花时间进行监督已有流程的运行,错误的改正。 远期是类似AutoBA的全自动agent,自动流程构建和数据分析。当然不排除可以部分流程的一步到位,或许未来一段时间还是人和AI相互配合解决具体问题。

    51910编辑于 2024-12-23
  • 来自专栏图形化开放式生信分析系统开发

    使用docker完成分析环境搭建

    开发人员最头疼的问题,可能就是平台搭建和软件安装了。部署和迁移上要费很大力气。本文讲述使用docker制作一个镜像,后续通过导入自己定制的镜像,复制文件完成分析流程的部署和迁移。 data目录, 保存待分析的文件。在docker里面挂载目录为:/opt/data result目录,保存分析中间文件和最终结果文件。 个人倾向于选择Ubuntu18.04,官方宣布该LTS版本有10年支持周期,可以放心使用。 etc/sshd_config并保存 Port 9018 #修改默认端口号(可选) ListenAddress 0.0.0.0 #默认监听地址,所有地址 LoginGraceTime 10m 就可以在docker环境支持下快速完成分析环境的部署与迁移。 七、官方推荐使用docker-file来描述docker镜像创建过程,这里过程太过繁琐,就不继续折腾了。有兴趣的可以继续改进

    2.1K00发布于 2020-01-17
  • 来自专栏生物信息云

    分析不会?那就问问ChatGPT

    ChatGPT出来几个月了,我安装也有一段时间了,没试过,今天试了一下,看看会不会在我们分析中提供帮助,哈哈,的确,是真的很智能的!! DESeq2 对象 dds <- DESeqDataSetFromMatrix(countData, colData=sampleTable, design=wcondition) # 运行差异表达分析 seurat obj, annotation = "cluster annotation.csy") #加载必要的包 import scanpy as sc # 读取数据 adata = sc.read 10x counts_per_cell after=1e4) # 进行降维sc.tl.pca(adata, svd solver='arpack') # 进行聚类 sc.pp.neighbors(adata, n neighbors=10 ,n pcs=40)sc.tl.louvain(adata) #进行细胞通讯分析sc.tl.cell communication(adata, type='all') # 输出结果 adata.uns[

    72730编辑于 2023-02-27
  • 来自专栏生信小驿站

    不会编程如何分析(1)差异分析

    本文目的:解决在不会编程的情况下用exel做差异分析 (1)首先准备一个数据框文件,每一列为一个样本(第一列为基因名),每一行为一个基因。 ?

    1.3K21发布于 2019-11-07
  • 来自专栏芒果先生聊生信

    复现论文36.差异分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 论文36是单基因分析论文,单纯数据库的数据分析,没有湿实验验证,但是可以发表在接近5分的期刊上,很多分析做得很棒,值得借鉴。我们对文章数据进行复现。 第一部分就是差异分析。 上述oncomine热图、三线表和TIMER散点图的差异分析结果,在PPT里面进行标注和整合即获得用于发表的图片。 差异分析就是如此简单。 当然,果友们最常见的疑惑是,如何获得可用于差异分析、生存分析和探究意义的基因。确实,这是分析的难点之一。个人也没有更好的办法,只有多读文献,多去做分析,多去尝试几个基因。

    1.6K20发布于 2020-07-20
  • 星球--入门DAY1

    R语言R 语言是为数学研究工作者设计的一种数学编程语言,主要用于统计分析、绘图、数据挖掘。 这些数据包括基于单通道和双通道微阵列的实验,检测mRNA,基因组DNA和蛋白质丰度,以及非阵列技术,如基因表达系列分析(SAGE),质谱蛋白质组学数据和高通量测序数据。

    36410编辑于 2024-01-17
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式分析系统开发 - 4 分析流程图形化

    在上文图形化开放式分析系统开发 - 3 分析流程的进化 讨论了分析pipeline的进化,从手动到自动,但仍然停留在终端命令行阶段,为了让更多非专业的人能够使用,就要想办法实现分析pipeline 变量的分类: 根据实际经验,pipeline变量用到根据用途可以分为以下几类: 分析数据目录${data} 分析过程输出目录${result} 分析用到的软件 bwa ${tools.bwa};samtools ${tools.samtools} 分析流程中用的reference文件以及数据库,如 hg19.fa ${ref.hg19} 分析流程中,用到的cutoff值. /节点设计:前文提到,分析pipeline其实就是基于文件输入输出的工作流,这里对工作流做了简化,归纳起来工作流中有4种节点。 Task节点,输入文件,运行分析过程,输出分析过程运行结果 task.png task_menu.png 4.

    1.1K00发布于 2020-01-17
领券