首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏医学数据库百科

    临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系。如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了。 ClinVar 数据库是ncbi旗下用于查看临床相关突变的数据库。但是其数据库的内容比较多,而且检索界面不是很友好。所以经常看不懂其结果。所以今天就介绍一个检索简单的突变和表型的数据库。 通过其名字我们就知道这个是一个简易版的Clinvar数据库。 输入 数据库的输入很简单,我们可以数据疾病;基因名; 突变等。都可以。 我这里输入gastric cancer。 另外数据库也提供了下载的功能。我们点击Show Table就可以看到其下载结果的地方了。 写在后面 以上就是这个数据的所有功能的。输入关键词—界面友好的查看结果。是不是很简单。 一直再说这类汇总其他数据库的资源,最怕的资源更新慢的问题。不过看这个数据库还是经常更新的。所以可以放心使用的

    1.3K40发布于 2021-11-18
  • 来自专栏生信技能树

    TCGA数据库临床资料官方大全

    因为TCGA计划跨时太长,纳入研究的病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整的系统性的公布了权威的临床资料。 依托于文章 Cell. 2018 Apr 5 :[An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival 下载链接:TCGA-CDR 看起来是乱码,但的确是真实的下载地址:https://api.gdc.cancer.gov/data/1b5f413e-a8d1-4d10-92eb-7c4ae739ed81 题外话:关于不同数据源的TCGA临床资料冲突的讨论 关于生存分析的冲突问题,我们多次讨论了: 集思广益-生存分析可以随心所欲根据表达量分组吗 寻找生存分析的最佳基因表达分组阈值 比如下面的代码比较两个数据源

    5.3K41发布于 2019-06-15
  • 来自专栏生信宝典

    临床基因组分析相关数据库汇总

    一、人群SNV频率数据库 数据库名称 网站 简介 dbSNP https://www.ncbi.nlm.nih.gov/snp/ dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表 2500个人的全部基因组可产生50 TB(5万 GB)的数据量,包含8万亿个DNA碱基对。 三、表型数据库 数据库名称 网站 简介 GeneReviews http://www.genereviews.org/ GeneReviews 是为忙碌的临床医生提供的国际即时护理资源,以标准化的期刊样式格式提供与遗传病相关的临床相关和医学上可操作的信息 DECIPHER https://www.deciphergenomics.org/ 使用Ensemble基因组浏览器,将基因芯片数据和临床表型进行关联,便于临床医生和研究人员使用的细胞分子遗传学数据库 EVenn http://www.ehbio.com/test/venn/ 5种Venn图和Venn网络快捷在线绘制。

    2.7K20编辑于 2022-01-19
  • 来自专栏生信菜鸟团

    临床模型 | 大型语言模型编码临床知识 | Nature

    在更困难的带有 5 个选项的问题集合中,我们的模型达到了 62.0% 的准确率。 然而,鉴于领域无关的指令调优在回答多项选择题方面的成功,在领域内的指令提示调优看起来很有前景,我们在扩展数据表 5 中展示了初步结果,并在补充信息第 5 节中进一步描述了该实验。 Fig. 5: Evaluation of comprehension, retrieval and reasoning capabilities by clinicians. - 图片说明 ◉ 评估阅读理解 Para_02 尽管通过指令提示调优改进了性能,但专家生成的答案仍然优于 Flan-PaLM(图 5)。 这种趋势在用于评估这些能力的六个子问题中均有所体现。 我们的研究基于 PaLM,其技术细节已得到广泛描述,并且我们机构已经开源了多个相关的大型语言模型,以推动该领域研究方法的发展(https://huggingface.co/google/flan-t5-

    46400编辑于 2025-03-28
  • 来自专栏生信喵实验柴

    临床样本检测

    国际顶级学术期刊 Nature Biotechnology 以《纳米孔上的临床宏基因组学》(Clinical metagenomics on a nanopore)为封面,刊登了英国东安格利亚大学 Justin 据悉,为了能够准确、快速地识别细菌病原体,研究团队开发了一种能够从临床样本中去除多达 99.99%的宿主核酸的流程,并在便携式 MinION 测序仪上开展了实时的检测和分析。 该团队在 40 个临床呼吸道样品上进行初期测试,在另外 41 个样品上进行了优化和测试。与培养法和 PCR 相比,优化的流程具有较高对病原体鉴定的敏感性(96.6%)和临床特异性(41.7%)。 文章地址: https://www.nature.com/articles/s41587-019-0156-5 1.2 文章详细解读 宏基因组公众号文章《NBT 封面:纳米孔基因组测序快速临床诊断细菌性下呼吸道感染 5. 纳米孔宏基因组学可以快速准确地表征细菌 LRI,有助于减少广谱抗生素的使用。

    78120编辑于 2023-02-24
  • 来自专栏百味科研芝士

    5分+整合多中心临床样本构建5分子胰腺癌预后模型

    文章利用从临床搜集的胰腺导管腺癌(PDAC)病人样本,通过LASSO算法及Cox回归分析,构建5分子预后模型,同时利用生存曲线、ROC曲线和多变量Cox回归分析验证了该模型的预后价值,并评估该模型预测术后 在多变量分析中,5分子预测模型是唯一重要的预后指标。此外,该预测模型与传统的临床病理变量相结合,可以大大提高其长期生存的预测能力。 此外,与临床病理特征不同,该5分子预测模型是唯一的在3类数据中均为独立预后因素的因素(表1)。 ? 在根据上述临床病理参数分层的大多数癌症亚组中,5分子预测模型也可有效区分不同的DSS(图3)。 5分子预测模型显示出更强的预测能力,与单个基因预测相比,AUC和HR高得多(图4a、b)。与主要的临床病理因素相比,该预测模型似乎在某些方面具有优势,尽管这并不明显优于N期和组织学分级。 此外,与单独的临床病理因素相比,单独的临床病理变量和该预测模型的组合显示出更好的预测能力(图4d)。因此,本文推测5分子预测模型可以为临床病理特征增加明显的预后价值。 ? ? ? ?

    84910发布于 2020-07-15
  • 来自专栏科研菌

    5+分思路:非编码RNA结合临床预后进行分析

    BLCA患者的临床特征 作者再次排除了34例没有缺少TNM分期和年龄等临床特征数据的患者,随机定义剩下一半患者为”primary dataset“,而整体患者为”entire dataset“,两组间临床特征无显著性差异 图5. 而对于IV期患者,高/低风险组的生存期没有显著差别(图5A-C)。按年龄进行分层分析时,高低风险组也仅在大于65岁的亚群中有显著差异(图5D-E)。 4. 用列线图预测5年总生存期的校准图 D图:(数据集:primary dataset) 用列线图预测3年总生存期的校准图 E图:(数据集:primary dataset) 用列线图预测5年总生存期的校准图 5. 列线图以及其单个因素的生存预测能力 ? 图7.

    79020发布于 2020-06-29
  • 来自专栏百味科研芝士

    基于SEER数据库临床预测模型轻松发3分SCI

    今天继续和大家分享一篇临床预测模型文章,同样是基于SEER数据库的一篇预测模型,于2019年11月发表在Annals of Translational Medicine(IF=3.689)上。 of prognostic nomogram for young patients with gastriccancer 标题:建立并验证青年胃癌患者预后的预测模型 文章总体概览: 作者通过检索SEER数据库 此外,作者建立了3年及5年的校准曲线,结果表明列线图预测的生存率(包括OS及CSS)与实际生存率具有较高的一致性,见图5(此推送仅展示OS结果,CSS类似)。 图5. 校准曲线(OS) ? 图6. DCA结果 笔者总结:本文通过SEER数据库建立了青年胃癌患者OS和CSS的预后预测模型,并进行了验证。 通过统计学分析+R语言技术建立了临床适用性较强的Nomogram。

    4.8K33发布于 2020-02-24
  • 来自专栏用户7627119的专栏

    玩转TCGA临床信息

    对作者是如何从307个early-stage cervical cancer (CESC)病人中根据临床信息挑选出145个病人的过程有些疑惑。下面是原作者筛选样本的标准。 ? 首先我们要从TCGA中下载CESC的临床信息,在TCGA中搜索CESC,选择TCGA-CESC。 ? 选择miRNA样本,点击307这个超链接。 ? 任意选择一个样本,点击进入。 ? 点击Download下载,里面就包含所有样本的临床信息 ? 解压到当前文件夹 ? 更多临床信息解读可以参考肿瘤TNM分期。 ? ? 这就和原文中的表1中的数字相同了。 ? 接着我们检查一下相应的Tumor Grade样本数是否正确。

    1.7K41发布于 2020-08-06
  • 来自专栏Android开发指南

    5.数据库

    5.数据库 数据库的操作 创建数据库create database mydb ; 查看创建数据库的语句show create database mydb ; 改变当前的数据库use mydb ; 删除数据库 drop database mydb ; 查看所有的数据库show databases ; 修改数据库mydb1的字符集为utf8 alter database mydb1 character set ,先创建数据库,再获取可读可写的数据库对象,如果数据库存在,就直接打开,增删改用这个 SQLiteDatabase db = oh.getWritableDatabase(); //如果存储空间满了 数据库常用操作 用到数据库就要想到 数据库单例,保证只要一个实例 定义javaben对象 将Javaben对象存到数据库数据库读取 实例: CoolWeatherOpenHelper public 使用这种方式来维护数据库的升级,不管版本怎样更新,都可以保证数据库的表结构是最新的,而且表中的数据也完全不会丢失了。

    90980发布于 2018-05-14
  • 来自专栏生信技能树

    TCGA数据库| 如何将表达矩阵与样本临床数据进行合并?

    前面我们已经给大家介绍过TCGA数据库中样本barcode的详细组成:TCGA样本barcode详细介绍,现在我们来看看如何将基因表达矩阵与样本临床信息进行合并,方便后续做 比如生存分析,基因在不同样本分期 TARGET-AML" "MATCH-Z1I" "HCMI-CMDC" "MATCH-W" # [5] ) ## 再次加载 load("TCGA-BRCA.transcriptome.Rdata") ls() names(assays(data)) rowdata <- rowData(data) 5、 ("tcga_mrna_fpkm_symbol.rds") head(colnames(mrna_fpkm)) # [1] "symbol_mrna" "TCGA-5L-AAT0 -01A-12R-A41B-07" "TCGA-A2-A04U-01A-11R-A115-07" "TCGA-AN-A04A-01A-21R-A034-07" # [5] "TCGA-A7-A13D-01A

    1.8K12编辑于 2025-01-08
  • 来自专栏临床预测模型

    临床预测模型—基于dcurves包的临床决策曲线(DCA)绘制学习

    净收益考虑了模型在某个阈值下的灵敏度(True Positives)与特异性(False Positives),提供了一种可以用于临床实际决策的量化指标。 Biom J. 2020 May;62(3):764-776.一点统计:https://mp.weixin.qq.com/s/0xLtnx5JppypsQdywKteXQ https://mp.weixin.qq.com 0iycRpUsDm1Ds3DTkEu4-A https://mp.weixin.qq.com/s/IrZwwQYCBDT63xH7QtfDvA https://mp.weixin.qq.com/s/g5iWSE6hwXh6rbpOn08DOg https://mp.weixin.qq.com/s/buajk82tUFH02ht9DH3RwA生信星球:https://mp.weixin.qq.com/s/PV5Ik5UW37r4V3E0UrKI8QYuLabSMU

    89510编辑于 2024-11-24
  • 来自专栏生信小驿站

    各种临床试验终点

    临床试验终点(End Point)服务于不同的研究目的。在传统的药物的研发中,早期的临床试验目的是评价安全性以及药物的生物活性,如肿瘤缩小。 后期的有效性研究通常评价药物是否能提供临床获益,例如生存期延长或症状改善等。 让我们一起来看看常用的临床试验终点都有什么区别以及优缺点。 临床试验中常常会用到 5 年生存率,即——某种治疗方案下,生存五年以上的患者比例。 除了 OS 外,其余的终点都是要基于肿瘤测量的。 因此,在临床试验设计中,「肿瘤进展」的标准必须要进行明确的定义,还包括 PFS 的评估、观察、分析方法,随访和影像学评价必须是均衡的,最好有一个由影像学专家和临床专家组成的处于盲态的独立裁定小组进行。 image 5年生存率 五年生存率系指经过各种综合治疗后,生存五年以上的比例。意义:用五年生存率表达有其一定的科学性。

    1.9K30发布于 2019-03-04
  • 来自专栏量子位

    谷歌自曝医疗AI临床结果不佳:实验室丰满,临床骨感

    实验室数据不断刷新记录的Google Health,最近公布了一项临床诊断试验结果。 不理想。 ? 不仅诊断结果不一致,而且实际操作方法和在实验室里压根不一样。 没想到,落到临床试验,却失败了。 这大概就是理想与现实的差距吧。理想有多丰满,现实就有多骨感。 像极了我们在大学实验室里做实验的样子。 ? 为了验证算法的性能,他们还使用了2个独立的临床试验数据集,包括1.2万幅图片,审核结果由专家来判决。 临床试验很“骨感” 这个项目主要是在泰国展开,与泰国公共卫生部门合作,在泰国巴吞他尼省和清迈省的11所诊所安装了这个深度学习系统。 同时,也给谷歌这种勇于“正视淋漓的临床结果”的态度,点个赞。 毕竟这个行业里,报喜的多,吹哨的少。 也提醒我们,医疗AI,没那么简单。

    66820发布于 2020-05-06
  • 来自专栏科研猫

    肿瘤基因检测与临床

    提到基因检测,前几年,临床医生在向患者推荐时还心存疑虑,而近两年,基因检测已成为癌症诊疗的标准动作,基本上每一个癌症患者都有一套自己的基因检测报告。不得不说,一个患者一套方案的个体化诊疗时代已经到来。 利用各种方法,把这些变异的基因找出来,仔细分析,可以协助临床诊断、指导治疗选择、辅助监测疾病复发和耐药、预估生存期等。 1、等位基因特异性PCR 优点:敏感性 - 需要突变存在1-5%。无需特殊设备。 缺点:目标特异性,无法检测到可能存在于肿瘤DNA中的其他突变。 3、焦磷酸测序 优点:快速和灵敏地检测5%水平的突变DNA。 缺点:需要焦磷酸测序仪器; 在可以在肿瘤DNA中检测到的突变类型方面受到限制。 5、单碱基扩展测定 优点:灵敏,可靠地检测突变DNA,如果以5-10%存在; 测试多个基因。无需特殊设备。 缺点:SNV特异性并且不能检测可能存在于肿瘤DNA中的其他突变。

    1.3K10发布于 2019-11-08
  • 来自专栏生信开发者

    Oxford Nanopore 的临床应用

    来自一名患有胎儿心动过缓(低心率)的女性新生儿的未解决样本数据表明,存在两种complex structural variations (cxSVs)结构的替代模型,其中一种或两种与早期婴儿癫痫性脑病相关的CDKL5基因拷贝被破坏 5. 下呼吸道感染 金标准培养需要48-72 hours 基于PCR的方法能减少时间但不能检测整个病原谱,而且不能检测耐药性 纳米孔测序提供的实时数据分析。

    87710发布于 2020-08-10
  • 来自专栏用户7627119的专栏

    TCGAbiolinks获取癌症临床信息

    今天我们来用R获取感兴 趣的癌症的临床信息,其中就可以找到我们上次讲到的TNM分期信息。 #加载TCGAbiolinks包 library(TCGAbiolinks) #下载TCGA-CHOL这个项目相关的临床信息,这个项目是胆管癌 clinical <- GDCquery_clinic(project = "TCGA-CHOL", type = "clinical") #将下载到的临床信息写入到clinical.csv文件中 write.csv(file="clinical.csv",clinical ) > dim(clinical) [1] 51 158 一共得到51个样本的临床信息,一共有158条临床信息,他们分别是 > names(clinical) [1] "submitter_id classification_of_tumor" [4] "last_known_disease_status" [5]

    2K30发布于 2020-08-06
  • 来自专栏机器之心

    临床PK完胜ChatGPT-5!国内团队造出首个OCT影像AI系统

    腔内影像中不同技术与分辨率的对比示意图 在这项纳入了 96 名患者、160 处病变的临床研究中,团队构建了一个严苛的竞技场:将 CA-GPT 系统、ChatGPT-5 以及拥有 1-5 年经验的初级介入医师放在同一维度下 评估涵盖 10 项预设决策指标,分为术前规划 5 项和术后评估 5 项,每项一致得 1 分,总分 0-5 分。 支架长度选择:CA-GPT 准确率达 80.6%,ChatGPT-5 仅为 54.2%。 但此次发布的 CA-GPT 系统及其临床成果,标志着中国企业在高端腔内影像领域开始掌握定义权。 不做通用大模型的「套壳」,而是深耕垂直场景的「窄门」。 这或许就是中国医疗科技的「DeepSeek 时刻」—— 把 AI 技术落地业务场景,用自己的技术,解决最真实的临床痛点。

    24510编辑于 2025-12-18
  • 肿瘤突变位点临床解读数据库:CIVIC、JAX CKB、My Cancer Genome

    作者,Evil Genius最近听美国人指挥,构建临床解读数据库,当然之前分享过数据库,文章在NGS基因测序(panel)报告解读数据库汇总 从工作的态度上看,我现在理解为什么科研人员都喜欢待在美国了。 1、CIVIC:免费开源的肿瘤突变位点临床解读数据库CIViC数据平台的全称是:Clinical Interpretation of Variants inCancer。 跟美国JAX数据库人员聊的时候发现确实美国科研人员十分的严谨,绝对是在完全掌握用处目的之后才会考虑是否将数据库提供给我们服务。当然了,我们这边主要是爬取数据库信息用于商业,这是对方严厉禁止的。 3、My Cancer Genome数据库数据库提供了癌症相关基因及特定癌症相关基因突变和临床相关性的最新信息,以及相关抗肿瘤药物类别、靶点和名称等信息,并且还收录了FDA批准或正在进行的临床试验,美国人特别推崇这个数据库 特点优势:为医生、病人、相关研究者提供了一个精准的肿瘤医学知识库实时更新肿瘤形成和发展的关键突变信息,以及相关治疗影响,包括目前的临床试验快捷搜索、匹配肿瘤突变和治疗的信息,辅助临床治疗数据来源:查询方面包括临床试验

    1.2K20编辑于 2024-05-11
  • 来自专栏LN生物笔记

    R语言 | GEO数据库的下载 以及表达矩阵和临床信息的提取

    library(tidyverse) 2.利用AnnoProbe下载GEO数据库中的数据 以GSE14520数据系为例: gset=AnnoProbe::geoChina('GSE14520') 运行后 ,会得到一个叫做“gset”的对象,它是”list“数据类型 3.提取表达矩阵和临床信息 exprset <- data.frame(exprs(gset[[1]]))#exprs用于提取表达矩阵信息 expMatrix <- gset[[1]] pdata<-pData(exp)#pData用于提取临床信息 gset[[1]] 的意思是,从gset这个对象中提取第一列数据。 提取第二个平台的表达矩阵 expMatrix <- cbind(expMatrix1, expMatrix2)#两个表达矩阵合并为一个总矩阵 pdata1 <- pData(gset[[2]])#提取第一个平台的临床数据 pdata2 <- pData(gset[[1]])#提取第二个平台的临床数据 那么如何判断你下载的这个GSE是有几个GPL呢?

    7.3K54编辑于 2023-02-23
领券