首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏图形化开放式生信分析系统开发

    图形化开放式分析系统开发 - 5 分析流程服务器端运行

    在上文图形化开放式分析系统开发 - 4 分析流程的图形化设计 讨论了分析pipeline的图形化,如何用图形的方式显示pipeline,但是pipeline脚本按照变量的形式保存之后,如何运行 分析过程状态、服务器运行状态,需要由服务器端推送到用户端。 综合考虑,结合软件设计目标,这里选择远程模式 运行服务器节点: 服务器节点信息: 经常手动分析脚本的朋友大家的习惯可能是,ssh远程登录Linux服务器,在shell控制台输入各种脚本,软件。 服务器信息2.png 针对分析流程,按照约定定义了两个变量:${data}数据输入目录,${result}输出目录 考虑到并行运算,这里设置了该账户可以并行运行的任务数量,已经连续运行任务的最小时间间隔 运行完成后服务器端推送信息到控制端,判断是否符合要求,输出文件是否存在 运行失败后服务器端推送信息到控制端,显示错误信息,错误日志,便于开发人员查找错误 统计每一个分析步骤的运行时间,便于统计分析

    95500发布于 2020-01-17
  • 来自专栏生信菜鸟团

    分析中linux的使用5-grep

    技能树学习笔记 Linux文本处理——grep grep:一种强大的文本搜索工具,它能使用正则表达式匹配模式搜索文本,并把匹配的行打印出来 格式:grep [options] pattern file 问题5:多个关键词匹配?

    33410编辑于 2024-07-10
  • 来自专栏芒果先生聊生信

    分析网站(生存分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 差异分析,无论是Oncomine,GEPIA,还是UALCAN、HPA数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 生存分析论文中经常出现的表型,也就是说基因在正常和肿瘤组织中表达的差异,与生存率的指标密切相关。如A基因在肿瘤中表达明显上调,生存率显著下降,这就是非常明确的相关性。 生存分析是非常重要的表型,诸多文章均有介绍。这里,我们对生存分析的纯数据库进行总结,果友们在选择时也可以作为参考。

    4.4K44发布于 2020-08-11
  • 星球——入门DAY5:数据结构

    )表示1-10之间每0.5取一个数从向量中提取元素x[4] #x第4个元素x[-4]#排除法,除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素x[x==10]#等于10的元素x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素数据框read.table(file="",sep="",header

    23500编辑于 2024-01-21
  • 来自专栏用户10800790的专栏

    星球 day 5 ——橙子🍊

    星球数据结构 向量vector 标量:1个元素 向量:多个元素 从向量中提取元素 x[4] x[x==10] 位置、逻辑值 数据框 a <- read.table(file='huahua.txt'

    19250编辑于 2023-10-25
  • 来自专栏芒果先生聊生信

    分析网站(免疫浸润分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。 生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 免疫浸润分析比生存分析、差异分析和相关性分析难度更大,因为免疫学是不断延伸、拓展的学科,并不断从理论走向应用、临床,兼有科学性和技术性,比如实验中已经普遍应用的免疫印迹(WB),流式分析,免疫组化和免疫荧光等等 分析中,有一种算法叫反卷积分析,英文名叫Deconvolution。 开发人员可以先通过预设一个优秀的数据训练集(训练集主要包含了每种不同免疫细胞的基因表达特征),然后通过反卷积算法推算出这个整体样本中究竟有哪些免疫细胞。

    7.7K43发布于 2020-08-12
  • 来自专栏生信技能树

    技巧第5课-人必须安装的软件

    长期更新列表: 视频讲解-R爬取软件列表到思维导图 技巧第二课-使用markdown记录和分享笔记 技巧第3课-请你务必学好R语言 broad官网出品的 必须神器 IGV 资料大全,含视频 不知不觉就第5讲了,本次视频没有干货,只是为了保证入门系列视频的完整性而录制的,没啥事就不用看了,反正你需要安装一些软件就可以了。 软件安装及使用 (官网,例子,conda) 多版本软件发布:NCBI的 blast以及sratoolkit 等等 二进制软件(预编译版本):下载即可使用 C源码软件:官网,readme,安装,解决配置文件及报错 系统软件中心:ubuntu的用apt-get,centos的用yum,macOS的App Store或者brew 成熟的软件管理中心:conda 保证一个纯粹的新手,生物学的本科,经过3个小时的折腾

    2K30发布于 2018-07-27
  • 5学习笔记-微公众号星球

    (4)显示工作路径 getwd()(5)向量是由元素组成的,元素可以是数字或者字符串。(6)表格在R语言中称为数据框^_^(7)别只复制代码,要理解其中的命令、函数的意思。 这里的x是你刚才赋值的变量名,根据自己的情况来修改x[4] #x第4个元素x[-4]#排除法,除了第4个元素之外剩余的元素x[2:4]#第2到4个元素x[-(2:4)]#除了第2-4个元素x[c(1,5) ] #第1个和第5个元素(2)根据值x[x==10]#等于10的元素x[x<0]x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素Part2:数据框将示例数据放在你的工作目录下(! "bioinfoplanet.RData")#保存当前所有变量save(a,file="test.RData")#保存其中一个变量load("test.RData")#再次使用RData时的加载命令(5

    48510编辑于 2024-02-24
  • 入门DAY5-6

    DAY5 本篇内容引自生技能树 六、R语言作图 1、作图分三类 #作图分三类 #1.基础包 略显陈旧 了解一下 plot(iris[,1],iris[,3],col = iris[,5]) text data = iris) + geom_point(mapping = aes(x = Sepal.Length, y = Petal.Length), size = 5, 5、画图扩展部分 (1)STHDA网站 (2)工作目录里有扩展学习的代码 (3)小洁老师语雀画图合集 DAY6 七、R语言的综合运用 引自生技能树 1、玩转字符串 引自生技能树 rm(list = ### 3.按位置提取字符串 str_sub(x,5,9) ### 4.字符检测 str_detect(x2,"h")#这串逻辑值的特点是:长度与向量x2一一对应,且长度相等。 x = rnorm(3) x ifelse(x>0,"+","-") #ifelse()+str_detect(),王炸(差异化分析分组时可用) samples = c("tumor1","tumor2

    41220编辑于 2025-05-27
  • 来自专栏芒果先生聊生信

    分析网站(欢迎收藏)

    分析,无论是Oncomine,GEPIA,还是KM Plotter数据库,都不需要R语言编写代码,容易上手,基本上一个星期甚至更短的时间就可以搞定,属于菜鸟级别生操作。并没有想象中那么难。 p<0.05就是我们前期做分析想要的结果,即使用GEO数据库、TCGA数据库做分析,甚至做芯片或测序,没有差异也是枉然。 对于医生,个人建议是最好学会R语言,最起码掌握不用R语言的数据库分析。 最重要的是阅读过的文献和做过的分析,可以进一步促进对临床上疾病的认识,提升医生的诊治水平。 ? 接下来,我们将按照中心法则和论文分析的思路总结分析的网站。 这些网站均是纯数据库,不需要R语言基础,就像Excel、PPT一样容易上手,只要你愿意学,肯定能学会。 差异分析数据库 oncomine数据库(差异分析首选) https://www.oncomine.org/resource/main.html GEPIA数据库(共表达是特色) http://gepia.cancer-pku.cn

    3.1K20发布于 2020-08-10
  • 来自专栏生信入门

    星球Day5 Linux

    今日学习内容:认识linux,使用云服务器linux的常用指令---云服务器上的linuxmac: terminal页面中输入 ssh 用户名@ip地址win: 下载xshell,教程:https://

    30020编辑于 2023-07-22
  • 来自专栏生信菜鸟团

    分析之conda安装

    技能树学习笔记 Anaconda 的官网是 https://www.anaconda.com/ 官网上介绍anaconda是所有语言的包、依赖和环境管理器。 Conda之间的关系如下 当我们使用服务分析数据,我们使用miniconda,如果在自己的电脑上使用anaconda。 因为在数据分析过程中我们要使用很多种软件,软件安装中会遇到各种问题。 基因组、转录组、Chip-seq…… 具体步骤: # 创建名为rna的软件环境来安装转录组学分析的生物信息学软件 conda create -y -n rna python=3.7 这一步输入y或回车都可以 conda remove -n rna fastqc 不指定-n参数就得进入该环境之后才能进行删除操作,同样,-y能够跳过确认执行的步骤 Conda常用命令 补充 技能树学习笔记 前情提要:1.安装

    1.2K10编辑于 2024-07-10
  • 来自专栏嗨嗨嗨

    学习小组DAY5

    (4)显示工作路径 getwd() (5)向量是由元素组成的,元素可以是数字或者字符串。 (6)表格在R语言中改名叫数据框 (7)函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:? 图片 赋值 图片 从向量中提取元素 元素位置 x4 #x第4个元素 x-4#排除法,除了第4个元素之外剩余的元素 x2:4#第2到4个元素 x-(2:4)#除了第2-4个元素 xc(1,5) #第1个和第 5个元素 图片 根据值 xx==10#等于10的元素 xx<0 xx %in% c(1,2,5)#存在于向量c(1,2,5)中的元素 图片 数据框 X=read.table("\Rstudiotestdoudou.txt

    38420编辑于 2023-07-01
  • 来自专栏芒果先生聊生信

    分析网站(相关性分析

    论文的套路 ONCOMINE从全景、亚型两个维度做表达差异分析; 临床标本从蛋白水平确认(或HPA数据库),很重要; Kaplan-Meier Plotter从临床意义的角度阐明其重要性; cBio-portal 数据库做基因组学的分析(机制一); STRING互作和GO/KEGG分析探讨可能的信号通路(机制二); TISIDB/TIMER分析肿瘤免疫特征(机制三)。 在差异分析的前提下,表型分析成为重点内容,也是可以玩出花样的地方。生存分析是非常常见的表型分析。与生存分析相比,相关性分析是另外一个常见的表型分析。 严谨的论文还对分析结果做出ROC曲线,以提高数据的可信度和说服力。 ) http://www.oncolnc.org/ cBioPortal(组学分析神器也能做生存分析) https://www.cbioportal.org/ 差异分析数据库 oncomine数据库(差异分析首选

    5.5K21发布于 2020-08-11
  • 来自专栏生信技能树

    第一步-购买腾讯云服务器搭建自己的分析环境

    一.腾讯云服务器-构建分析环境 01.硬盘设置 挂载数据盘,我先买了200G的云数据盘,暂时够用,手动挂载后,需要进入服务器,再次进行挂载 df -h # 服务器原始的状态 ? 这里要特别感谢技能树群里的小伙伴,jimmy、skk、李东野、黯蓝、卖萌哥、小洁,在他们的热心帮助下,解决了这个问题!万分感谢!问题出在腾讯云的安全组设置! ? ? ? ? rstudio ? ♚ OK,到这里,配置就完成了!前前后后、反反复复,配置一个云服务器,花了3天的时间,设置自动挂载、寻找源,一个个的解决问题,这还是在有优质的教学视频的前提下,假如没有,学习成本还要高得多。 这里,真的要大力推荐 技能树团队 的教程, 感谢jimmy等一批无私分享者!对于我们这样的小白,实在是务必珍贵的资源,希望更多人能够看到,并从中学习到想要的技能、知识! 参考: 技能树公众号 - 所有的教程都值得仔仔细细的学习 R官网教程 https://cran.r-project.org/bin/linux/ubuntu/README.html#secure-apt

    4.7K22发布于 2020-04-02
  • 来自专栏笔记生信

    提升day5-婷

    3:设置行名列名4:数据框的导出:write.table(x,file = "yu.txt",sep = ",",quote = F)5:变量的保存与重新加载save保存,load加载6:提取元素7;用内置数据集画散点图 8:保存到工作目录问题回答因为找不到对象了,这时需要去重新run一下x的赋值代码思维导图星球公众号

    20910编辑于 2023-11-18
  • 来自专栏作图丫

    5分+细胞焦亡分析,换种癌症可重复!

    背景介绍 细胞焦亡的纯分析是今年的一大热点,今天小编继续给大家带来细胞焦亡系列文章———细胞焦亡相关基因在肺腺癌中的分析。 clusterProfiler等许多方法均可用于富集分析。 可以使用TIMER数据库 的“gene”模块复现(图5)。肿瘤突变负荷(TMB)和微卫星不稳定性(MSI)可以作为肿瘤的预后标志物,可以使用临床之家复现(图6)。 Fig. 7 小编总结 相比于第一篇细胞焦亡基因的分析(跟上热点!5+细胞焦亡分析思路来咯!),本文的研究结果更好,也预测了一条潜在的调控轴。 不过这篇焦亡分析为我们提供了很好的思路,完全可以在其他癌症中复现。

    1K20编辑于 2022-03-29
  • 来自专栏百味科研芝士

    单细胞测序结合分析发优质的5分+文章

    二、分析流程 ? 图2b:正常,免疫和肿瘤细胞之间的配体-受体相互作用数热图 5.LSCC组织的肿瘤细胞异质性 图3a突出显示每个肿瘤细胞簇的t-SNE图,伪分化轨迹分布,共表达标记基因和GO功能富集结果。 永生肿瘤细胞高表达标志物MTRNR2L1,MTRNR2L8和MTRNR2L12,而转移肿瘤细胞高表达SERPINB5,GJA1和TM4SF1,功能富集结果表明它们分别与受体拮抗剂活性和膜通透性调节相关。 图5a:标志基因与TCGA-LSCC肿瘤等级的相关性 6.LSCC组织中肿瘤细胞簇的空间位置 最后作者比较了HE染色、SPRR3蛋白和Ki67(MKI67)的IHC染色的结果,定位不同肿瘤细胞簇的位置 图5b:LSCC组织中的HE染色,Ki67和SPRR3的IHC染色 ?

    4.2K51发布于 2020-10-09
  • 来自专栏生信马拉松

    马拉松 Day5

    今天的内容主要是关于学习的思路,另外学习了文件的读取和输出1.解决问题的正确姿势(1)检查代码和环境是代码错误?还是工作目录改变? 找不同比较能正确运行的数据和出错的数据,可能出现的情况有:异常值INF,重复值、非法输入、数据类型、数据结构(3)搜报错复制error信息,浏览器搜索(注意只需要复制报错的冒号后半句)(4)有效提问 (这个思路很重要,不只是提问 ,不要等待别人追着帮助自己,而是主动讲明白疑问点,日常工作交流都会受益)a.前因、后果、目的:在做什么分析,做了什么,导致现在的结果,目的是完成什么,才做的尝试,特别是外来的代码+b.代码、数据、报错截图 导出为普通表格文件export(iris,file = "iris.csv")#导出列表ls = split(iris,iris$Species)export(ls,file = "ls.xlsx")技能树 ,马拉松

    51800编辑于 2024-01-13
  • 来自专栏2023生信技能树学习记录

    技能树笔记day5

    ---title: "技能树学习笔记"引用自生技能树author: "天空"date: "2023-01-02"output: html_document---一、文件读写1. V1## 1 id## 2 66e33592-2e6e-4e50-8a5b /ex1.txt",header = T)ex1[1:3,1:3]## id## 1 66e33592-2e6e-4e50-8a5b ## 2 nationwidechildrens.org_clinical.TCGA-W5-AA2O.xml b83ddabb84f4a71ad3fa95cae64d0b10## 3 nationwidechildrens.org_clinical.TCGA-W5 实战项目的组织方式之一图片5. 实战项目的组织方式之二图片6.

    51461编辑于 2023-01-16
领券