首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信修炼手册

    OncoKB:肿瘤药物相关基因组变异数据库

    /doi/full/10.1200/PO.17.00011 数据库的网址如下 http://oncokb.org/ 该数据库以基因为中心,提供了每个基因上的变异,相关肿瘤类型,实验证据等信息,示意如下 其中level1和level 2A是具有临床意义的基因组变异,通过Actionable Genes菜单,可以查询基因组变异与药物的互作信息,示意如下 ? 点击每个基因ID, 可以查看该基因上所有的基因组变异,分为两类 Clinically Relevant Alterations All Annotated Alterations 以ABL1为例,示意如下 通过Cacner Genes菜单,可以查询肿瘤原癌基因和抑癌基因的列表,示意如下 ? 除了查询功能外,该数据库还提供了命令行工具,用于注释自己的基因组变异信息,支持SNV, CNV, 融合基因等信息的注释,该工具名为oncokb-annotator, 网址如下 https://github.com

    2.3K30发布于 2019-12-19
  • 来自专栏全栈程序员必看

    mirna预测基因结果怎么看_基因预测

    前两篇介绍了4种基因预测软件的下载与安装,以及数据的准备过程。本篇将正式开始进行基因的预测, 并对4种个软件的结果进行整理,最终得到4软件结果的交集。 基因预测 1、miRanda miranda file1 file2 [options..] miranda的使用需要准备两个文件,file1是miRNA序列的fasta文件,file2是mRNA序列的 结果整理 miranda结果 targetscan结果 RNA22结果 PITA结果 以上是4种软件基因预测结果, miRNA和mRNA名称在前两列中, 并且以制表符tab分隔, 我希望从文件中提取前两列的信息 从结果可以看到,4种软件的交集结果有8763条,意味着测试的miRNA在总转录本中有8763条潜在的,记住是,不是基因,因为一个基因可能在多个miRNA中有. .txt', 'a') as r: r.writelines(line) 有了基因名称就可以做一些KEGG富集分析了.

    2.1K60编辑于 2022-11-17
  • 来自专栏智药邦

    AI+基因治疗|Evozyne与武田达成多个研究合作

    2022年4月5日,开创基于进化的蛋白质设计的生物学公司Evozyne宣布,它已与武田达成战略研究合作和许可协议,研究和开发下一代基因治疗的蛋白质,用于多达四个罕见疾病。 在完成和审查某些研究成果后,武田可以选择获得独家许可,开发和商业化新型蛋白质序列,作为其基因治疗计划的一部分。 如果在合作过程中在适应症上实现了所有的里程碑,该公司还有资格获得未来的开发、监管和商业里程碑付款,以及合作产生的任何商业产品的净销售额的分阶段使用费,金额高达4亿美元。 "生产高度分化的转基因 (transgenes) 对推进下一代基因疗法至关重要",武田罕见疾病药物发现部门负责人Madhu Natarajan说。" 通过扩大我们与Evozyne的合作,我们有机会在新的疾病上利用他们新颖的蛋白质工程平台,希望有一天能够为患有罕见遗传病的患者提供功能性治疗。"

    33920编辑于 2022-06-08
  • 来自专栏聊点学术

    mirDIP 4.1:寻找miRNA基因的神器

    今天给大家介绍一款神器工具——mirDIP 4.1,网站是 http://ophid.utoronto.ca/mirDIP/index_confirm.jsp 这个工具的最厉害之处,就是它整合了很多miRNA基因预测工具 先和大家解释下这3个选项的功能,“Unidirectional search”每次单向地搜索miRNA的基因或者靶向该基因的miRNA;“Bidirectional search”则是在输入的miRNA 提示用户哪些基因名不存在,哪些基因名更新了,哪些基因名没有变,一目了然。 ? 第二部分,则是展示搜索的结果了。Links栏,存放了不同数据库中对该基因的注释信息。 04 “Bidirectional search”部分的使用则多了一内容。首先在输入的内容上就有所表现,毕竟是双向搜索,需要输入基因and miRNA。格式要求也和上面的一样。 ? 在结果展示和解读则不同,以网页的example为例进行搜索,可以看到所有的基因和miRNA都会展示在一个table里,方便用户知道哪条miRNA靶向了多个基因,哪个基因又被哪些miRNA靶向,方便做研究的清楚

    1.7K20发布于 2020-07-21
  • 来自专栏数据挖掘

    数据挖掘—疾病获取、批量读取差异基因以及Reduce函数的使用

    数据挖掘—疾病获取、批量读取差异基因以及Reduce函数的使用1 疾病获取数据库分析脓毒症肺损伤的疾病,获取疾病相关,除了从genecard、omim、disgnet等疾病数据库中搜索, 这里记录下在GEO数据库中获取的相关操作。一般找到合适的数据集后,我们可以拿到基因表达矩阵,做常规的差异基因表达分析,然后把差异基因作为疾病。 acc=GSE237861),进行并集操作(为了后续研究拿到足够多的基因,这里取了并集),这里我也疑惑作者单个样本是怎么获取差异基因的。 2 批量读取差异基因上述单个文件如下图所示需要对这些文件每个做一下操作,把满足logFC>1或logFC<-1,PValue<0.05的gene_ID拿出来# 获取每个病人关于肺的差异基因tmp1 = 假设我们有多个基因列表,想要找出它们的公共基因(交集):# 三个基因列表list1 <- c("geneA", "geneB", "geneC", "geneD")list2 <- c("geneB",

    85010编辑于 2024-10-18
  • 来自专栏用户7627119的专栏

    R下载合并ENCORI miRNA基因数据

    target=all",sep="") download.file(link,file) Sys.sleep(5) } 这里下载下来的是一个一个单独的文件,每一个文件里面包含一个miRNA和基因之间的调控关系 就像R批量预测miRNA和基因之间的调控关系-ENCORI篇里面使用的mRNA_miRNA_interaction.txt和lncRNA_miRNA_interaction.txt。 ="circRNA_miRNA_interaction.txt",combind_circRNA,quote=F,sep="\t",row.names = F) 合并完你就可以得到完整的miRNA和基因的调控关系了 参考文献 RNA相互作用神器——ENCORI R批量预测miRNA和基因之间的调控关系-ENCORI篇

    1.1K10编辑于 2022-09-21
  • 来自专栏单细胞天地

    自体免疫细胞技术

    Science期刊(Tran E et al, Science 2014)上,当时他们的做法是:把一名晚期胆管癌女患者的肺转移肿瘤病灶拿来做全基外显子测序,找到了26个非同义突变,并为每一个突变构建了一段短基因 ,将这些短基因几个一组地串联成短基因串(Tandem Minigene, TMG),然后将这些短基因串转入抗原递呈细胞(指树突状细胞DC)并与肿瘤浸润淋巴细胞(TIL)共同培养,以查看患者的TIL中是否存在可以特异性识别肿瘤突变的 首先看somatic变异 这里过滤后剩下 62 nonsynonymous somatic 变异位 ? TIL识别的两个基因突变 通过与前面文章类似的方法,构建TMG来挑选病人那些可以特异性识别这些突变的TIL细胞。 单细胞测序识别两个基因突变 挑选那些高表达T cell receptor (TCR)-β variable (TRBV) region or high expression levels of 4-1BB

    69410发布于 2020-03-27
  • 来自专栏生命科学

    重组蛋白 —— 药物 | MedChemExpress

    具有药理活性的生物 “” 一般指药物直接结合的那些蛋白质,比如酶、离子通道和受体或其他生物分子 (如 DNA、RNA、肝素和肽)。 药物靶标>蛋白大多数药物属于五个蛋白质家族:G 蛋白偶联受体 (GPCR)、离子通道、激酶、核激素受体和蛋白酶。G 蛋白偶联受体和酶是美国食品及药物管理局 (FDA) 获批药物两大类靶标蛋白。 药物筛选及优化中,重组蛋白可用于测试药物能否作用于潜在蛋白。同时,重组蛋白作为原料是生物药的质量、有效性和安全的重要保障。因此,重组蛋白成为了生命科学基础研究中的重要科研工具之一。 相关产品G 蛋白偶联受体GPCRs 介导细胞对大多数激素、代谢物、细胞因子和神经递质的反应,因此是药物发现的“富有成效”。 核受体蛋白核受体是一种重要的转录因子,能够调控细胞核内的基因表达,以响应各种胞外和胞内信号。核受体是药物发现的理想

    52510编辑于 2023-01-10
  • 来自专栏医学数据库百科

    基于实验的 ncRNA 查询

    对于这个数据库使用,还是很简单的我们只要数据自己想要查询的基因/miRNA即可。 ? 需要注意的是,这里我们需要输入的是一个成熟体的miRNA,例如:hsa-miR-34a-5p。 miRTarBase miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/php/index.php)也是一个基于实验基础的 miRNA 绑定基因查询数据库。 目标基因的信息以及预测到的结合位。 ? 相关文献的证据。 ? 在多个数据集里面表达的miRNA和mRNA表达的相关性,其中包括GEO和TCGA。 ? miRNA相关的网络图 ? 现在的一些数据库吧,如果不放点儿TCGA的分析,可能觉得跟不上趟,所以就肯定有了和这个 lncRNA 和目标基因在 TCG A当中的差异分析的结果。 ? 两个基因在TCGA数据库当中相关分析的结果。 不过呢。。。这个数据库使用的是两个基因原始的TPM数据来进行相关分析的。

    1.1K20发布于 2020-10-27
  • 来自专栏生信修炼手册

    ENCODE转录因子基因数据库

    ENCODE数据库中包含了许多转录因子的chip-seq数据,通过对chip-seq数据进行分析,可以预测得到该转录因子对应的基因数据。 通过整合多个转录因子的分析结果,就可以构建一个转录因子基因数据库,网址如下 http://amp.pharm.mssm.edu/Harmonizome/dataset/ENCODE+Transcription +Factor+Targets 该数据库中包含181种转录因子的基因数据,每种转录因子的基因对应一个数据集,示意如下 ? 从截图中也可以看到,虽然chip-seq数据有实验证据的支持,但是由于peak-calling的假阳性等问题,最终得到的基因的数量是非常多的,这其中的假阳性率不言而喻。 +Factor+Targets 上述链接可以下载转录因子ARID3A对应的基因数据,对于其他的转录因子,只需要替换掉对应的TF的名字即可。

    2.1K20发布于 2020-05-08
  • 第18篇HD文章--基因背景漂变识别缓解癌症治疗耐药的药物

    癌症对治疗的依赖性也各不相同。相同的突变在不同肿瘤中可能起到促进或抑制作用,并且表达相似水平药物的癌症,对小分子抑制剂的反应也可能存在差异。 筛选与联合用药策略基于背景漂移分数,研究团队筛选了13个潜在,筛选标准包括:同时出现在两种耐药网络的"召回"基因中、有临床可用且能穿透血脑屏障的抑制剂、已在儿童中测试过。 筛选策略为了找到能缓解AZD1390+放疗联合耐药的,研究团队对联合耐药肿瘤基因网络(GNReg-E)中的5,849个基因进行了筛选,标准包括:位于免疫群落且为"召回"或"新"基因;有临床可用且能穿透血脑屏障的抑制剂 达沙替尼脱颖而出多覆盖:达沙替尼靶向的基因中,有9个(如Lyn, Syk, Btk, Hck等)位于联合耐药肿瘤的免疫群落中。背景漂移分数高:这些基因的累积背景漂移分数最高。 对比鲜明:在未经治疗的CPC或单药耐药网络中,几乎找不到达沙替尼的,或背景漂移分数很低。

    10020编辑于 2026-03-07
  • 来自专栏生信小驿站

    如何预测miRNA基因(miRWalk2.0数据库)

    miRWalk2.0不仅记录了基因完整序列中的miRNA结合位,还可以将这些信息与12个现有miRNA-mRNA相互作用数据库:DIANA-microTv4.0,DIANA-microT-CDS, miRanda-rel2010 miRWalk2.0数据库的新特性: 结果归纳总结了13种不同的miRNA-mRNA预测数据库的信息 根据不同的miRNA结合位:启动子,CDS,5'和3'-UTR,线粒体基因组提供miRNA-mRNA 通过基因EnsemblID ? 仅仅修改输入基因名类型即可,其余后续步骤一致 ? 目前支持位点在基因的5UTR,CDS,3UTR 三种数据,但是一般miRNA的位点在3UTR区域,所以下载3UTR即可。 ? 这两种方式都可以,但是当输入一组基因时,一次性里面最多只能输入20个gene id或者gene symbol。如果你的输入基因太多,只能分批次输入。

    2.6K30发布于 2019-07-04
  • 来自专栏DrugAI

    . | TAPB: 用于纠正先验偏差的药物-预测去偏框架

    局限性 可视化结果注意力头之间的一致性较低,部分头关注噪声而非真实结合位;对于长序列靶标,注意力权重差异不显著,可能受序列长度和Softmax归一化影响; TAPB主要针对靶标偏差设计,在药物偏差显著的数据集上仍有提升空间

    14620编辑于 2026-01-06
  • 来自专栏生信技能树

    microRNAs基因数据库哪家强

    在自己的研究增加miRNA的角度也是极好的, 通常大家有4个需求: 想知道自己感兴趣的一个或者多个miRNA有哪些基因 想知道自己感兴趣的一个或者多个基因由哪些miRNA调控 想知道自己感兴趣的一个或者多个 miRNA跟哪些疾病或者药物相关 想知道自己感兴趣的一个或者多个miRNA是否调控自己感兴趣的一个或者多个基因 如果你也有上述需求,那么一个R包推荐给你,发表在Nucleic Acids Res. 2014 644186 14 targetscan 13906497 10442093 0 24348590 从miRNA到mRNA 查询自己感兴趣的一个miRNA有哪些基因 tolower)), ] 一个示例 下面是使用edgeR包,对普通的转录组counts表达矩阵(miRNA)做差异分析,并且拿到感兴趣的miRNA基因集 ,就可以查询它们的基因 library(multiMiR) # Plug miRNA's into multiMiR and getting validated targets multimir_results

    1.9K41发布于 2020-04-21
  • 来自专栏医学数据库百科

    综合性miRNA基因预测数据库

    写在前面 对于miRNA基因的预测而言,目前有很多数据库都可以做。这些数据库的区别基本上在于纳入的数据量以及预测的算法不同。预测的结果总是有一些不同的,所以也就导致各个数据库的结果可能不是很一样。 数据类型输入 这个数据库提供了多种数据输入的方式,可以满足我们对于miRNA基因预测的各种需求。 1.输入相关想要预测的ID来获得miRNA调控信息。 这里输入的ID包括:miRNA、基因、lncRNA、circRNA、小分子物质、转录因子、表观遗传调控因子、假基因。 ? 2.提供基因的表达数据,从表达矩阵开始到差异表达再到miRNA调控网络一起做完。 3.提供miRNA的q-PCR的结果,分析差异表达的miRNA顺带的预测其基因。 我们这里就以其中一个,输入基因来预测miRNA调控网络来进行举例。 在输入基因进行miRNA预测的时候,我们来进行制定物种选择合适的选项之后。点击submit即可。 ?

    1.4K31发布于 2020-09-01
  • 来自专栏生信修炼手册

    利用bedtools预测chip_seq数据的基因

    通常在分析peak区域对应的基因时,会选取转录起始位TSS上下游一定长度的区域作为候选的基因范围,本文介绍下如何利用bedtools来对peak与TSS区域的overlap情况进行分析,从而得到基因 得到物种对应的TSS位信息 以hg38为例,通过UCSC的FTP服务可以得到物种对应的refFlat文件,链接如下 http://hgdownload.soe.ucsc.edu/goldenPath/ 在原始文件中是没有第一行的标题的,我手动添加的标题是为了方便描述每列的含义,从该文件中可以得到TSS位信息。 2. 整理TSS位信息 bedtools要求输入的文件格式为bed, gff, vcf等,这里我们需要把上述下载的原始文件转换为bed格式,用法如下 awk '{print $3"\t"$5"\t"$5"\ window -a hg39.tss.bed -b peak.bed -w 5000 -sm > overlap.txt 通过window这个命令,可以灵活的定义TSS上下游的区间,快速得到peak对应的基因

    2K30发布于 2019-12-19
  • 来自专栏生信小驿站

    药物和相关数据库

    6 219 个,195 770 个化合物,282个药物—相关的通路,6532 个药 物—相关的本体论,63 个细胞色素。 5.TDR 。 8.PharmGKB 包含遗传、基因组 学、分子和细胞表型数 据、药学基因组学研究临 床信息的知识库。 (1)包含心血管、肺、癌症等疾病、通路、 代谢等药动学和药物基因组学数据; (2)提供不同个体对药物的反应的遗传变异 数据。 20000 个基因,3000 个疾病,2 500 个 药,53 条通路,470 个基因变异。 9.STITCH 检索已知的和预测的化 合物与蛋白质相互作用 关系的数据库。 10.TTD 基于已发表文献和 实验验证的专业的具有 治疗效用的药物点数 据库。 (1)收录了已成功药物、临床和研 究型的数据,包含药物和的临 床信息,定期更新。

    3.4K30发布于 2021-04-12
  • 来自专栏生信技能树

    使用miRNAtap数据源提取miRNA的预测基因结果

    前面我们分享了:microRNAs基因数据库哪家强,提到了综合了12个网页工具的miRWalk,以及整合了7个工具的miRSystem,但是最后我们仍然是推荐R包multiMiR作为提取miRNA的预测基因结果的解决方案 首先看看,对指定的一个miRNA进行基因提取: rm(list = ls()) library(miRNAtap) library(topGO) library(org.Hs.eg.db) mir = 再看看它与miRSystem网页工具结果的差异 进入 http://mirsystem.cgm.ntu.edu.tw/ ,粘贴我们的 值得注意的是,该工具顺便对基因进行了生物学功能数据库的注释 ? 可以看到预测的基因是836个,有趣的是我们明明输入的是小鼠的miRNA,理论上基因应该是小鼠的,但是这个网页工具似乎是把人和鼠的基因模糊处理了. ? (因为不是这个领域,所以我并不清楚,不同数据库结果的30%左右的一致性是好还是坏) 既然是预测,就不可能多个工具完全一致,所以目前主流的做法是,选择5个以上数据库支持的基因作为该miRNA的最后列表。

    1.9K10发布于 2020-04-21
  • 来自专栏生信修炼手册

    TFTG:human转录因子基因数据库

    另外一种方式是建立在转录因子的motif已知的情况下,可以采用FIMO等软件在基因的启动子序列上进行查找,如果能够匹配上,说明该基因可能是基因,这种方式就是单纯的通过计算手段来预测基因,相对而言,假阳性率会更高 TFTG数据库全称是Transcription Factor Target Gene Databse, 是一个转录因子基因数据库,该数据库结合实验手段和分析手段来研究转录因子和基因之间的调控关系,示意图如下 对于转录因子USF1而言,其motif已知,首先利用FIMO软件在基因的启动子去查找对应的motif, 这里启动子区定义为转录起始位TSS上下游5KB, 通过这种方式找到了3个候选的转录因子结合位TFBS 然后根据DNAse-seq的结果,可以排除第三个位,因为其染色质不是开放状态,然后根据DGF印迹法的结果,排除了第一个位,在该位没有任何的印迹。 最后结合该转录因子的chip-seq实验的结果,基本可以确定第二个候选位是一个真实的TFBS。 该数据库综合利用上述多种实验和分析手段,最终构建出一个高可信度的转录因子基因调控数据集。

    2.8K30发布于 2020-05-08
  • 来自专栏智药邦

    癌症识别中的人工智能

    他们发现疾病相关基因在高度重叠的模块中明显富集,这表明预测的模块可能有助于识别新的抗癌。 最后,确定的网络模块被用来发现作为癌症潜在治疗 (或生物标志物) 的关键基因。在此,我们展示了基于网络的生物学分析应用的关键识别程序,如下所示。 图9 基于网络识别新型抗癌的工作流程 在步骤1中,通过差异基因表达分析计算所有对基因和miRNA之间的相关性,并构建两个相似性矩阵。 基于ML的生物网络分析应用于分类,是通过确定分类的关键因素来确定关键。它认为定义类别的特定生物标志物 (如基因或蛋白质节点) 是关键。 在第2步,他们通过计算口袋的物理化学特性来预测口袋的可药性。在第三步,他们筛选了三个中心基因:HEY2、TNIK和LRP4。

    93820编辑于 2022-06-08
领券