首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏科研菌

    5+分新思路:公开数据库+简单实验验证!

    作者通过构建PD-L2特定靶点的珠芯片,并利用TCGA数据库中的相关数据来进行相关性分析和p-value分析,发现了PD-L2甲基化→mRNA表达量变化→黑色素瘤病人存活率变化的具体途径和机制。 从Spearman相关性分析和p值检验可以看出,在5个甲基化的CpG位点中,PD-L2甲基化与mRNA表达量之间有显著的负相关性。 图4 5.PD-L2甲基化通过影响IF-γ的表达,从而影响了PD-L2蛋白质的表达 作者用IF-γ对细胞系进行了72h处理,结果发现:PD-L2甲基化显著影响了PD-L2蛋白表达(p= 0.014)(图5a); 作为对照,作者分别对不同的细胞系进行了IF-γ处理/对照处理,结果发现:PD-L2甲基化与PD-L2蛋白质表达没有相关性(p=0.34)(图5b)。 图5 6.PD-L2甲基化和mRNA表达量显著影响了黑色素瘤患者的生存率 作者对不同CpG位点和mRNA表达量分组,研究了每一组对应的患者生存率(图6)。

    68410发布于 2020-12-08
  • 来自专栏医学和生信笔记

    机器学习和临床预测模型公开课全文及回放

    周五公开课文字内容以及录屏回放。 视频已上传到b站,我的b站账号:阿越就是我 本文目录: 从医学统计到机器学习 机器学习在临床中的应用 机器学习和临床预测模型有什么关系? 唯一不同且是最重要的一点:临床预测模型更加注重结合临床背景进行解释。 临床预测模型必须不能脱离临床,单纯的数字游戏没有任何意义。 很多讲临床预测模型的课程,涉及的机器学习基本方法太少,指南里的东西大家都知道,满足不了大家发文章的需求。 生信常见的各种数据库id, hgnc gene symbol, entrez id, ensembl id等?中心法则?表观遗传涉及哪些内容?什么是甲基化?单核苷酸多态性SNP, 拷贝数变异CVN? 模型的解释:临床预测模型必须不能脱离临床,单纯的数字游戏没有任何意义。

    1.9K32编辑于 2023-02-14
  • 来自专栏医学数据库百科

    临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系。如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了。 ClinVar 数据库是ncbi旗下用于查看临床相关突变的数据库。但是其数据库的内容比较多,而且检索界面不是很友好。所以经常看不懂其结果。所以今天就介绍一个检索简单的突变和表型的数据库。 通过其名字我们就知道这个是一个简易版的Clinvar数据库。 输入 数据库的输入很简单,我们可以数据疾病;基因名; 突变等。都可以。 我这里输入gastric cancer。 另外数据库也提供了下载的功能。我们点击Show Table就可以看到其下载结果的地方了。 写在后面 以上就是这个数据的所有功能的。输入关键词—界面友好的查看结果。是不是很简单。 一直再说这类汇总其他数据库的资源,最怕的资源更新慢的问题。不过看这个数据库还是经常更新的。所以可以放心使用的

    1.3K40发布于 2021-11-18
  • 来自专栏生信技能树

    TCGA数据库临床资料官方大全

    因为TCGA计划跨时太长,纳入研究的病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整的系统性的公布了权威的临床资料。 依托于文章 Cell. 2018 Apr 5 :[An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival 下载链接:TCGA-CDR 看起来是乱码,但的确是真实的下载地址:https://api.gdc.cancer.gov/data/1b5f413e-a8d1-4d10-92eb-7c4ae739ed81 题外话:关于不同数据源的TCGA临床资料冲突的讨论 关于生存分析的冲突问题,我们多次讨论了: 集思广益-生存分析可以随心所欲根据表达量分组吗 寻找生存分析的最佳基因表达分组阈值 比如下面的代码比较两个数据源

    5.3K41发布于 2019-06-15
  • 来自专栏生信宝典

    临床基因组分析相关数据库汇总

    一、人群SNV频率数据库 数据库名称 网站 简介 dbSNP https://www.ncbi.nlm.nih.gov/snp/ dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表 2500个人的全部基因组可产生50 TB(5万 GB)的数据量,包含8万亿个DNA碱基对。 三、表型数据库 数据库名称 网站 简介 GeneReviews http://www.genereviews.org/ GeneReviews 是为忙碌的临床医生提供的国际即时护理资源,以标准化的期刊样式格式提供与遗传病相关的临床相关和医学上可操作的信息 DECIPHER https://www.deciphergenomics.org/ 使用Ensemble基因组浏览器,将基因芯片数据和临床表型进行关联,便于临床医生和研究人员使用的细胞分子遗传学数据库 EVenn http://www.ehbio.com/test/venn/ 5种Venn图和Venn网络快捷在线绘制。

    2.7K20编辑于 2022-01-19
  • 来自专栏从百草园到三味书屋

    公开重症监护数据库MIMIC代码仓库介绍

    ; EHR二次分析需要临床专家和数据科学家的合作,在EHR数据库上推导或者定义一些概念是需要资源的,对于没有特别强的临床背景或者数据科学技能的人来说巨大障碍; 该文介绍MIMIC代码仓库,介绍与重症相关概念的导出以及相关假设条件等 ; 公开数据已经逐渐有了,公开相应的数据代码同样重要。 疾病严重程度评分Severity of illness scores 在回顾性数据库中难以计算 大多都是在前瞻性实验中获取的; 常规收集的数据缺相应元素。 SOFA), Logistic Organ Dysfunction system(LODS) 治疗时间Time of treatment 由于数据获取的限制,许多药物和确切的治疗时间无法得出,需要根据临床经验识别其他可替代的数据 结论 公开数据库的案例已经不少,为了让研究更加透明,也需要公开相应数据分析和数据处理的代码 补充 代码库地址:https://github.com/MIT-LCP/mimic-code 之前以MIMIC-III

    2.1K10编辑于 2023-03-09
  • 来自专栏百味科研芝士

    5分+整合多中心临床样本构建5分子胰腺癌预后模型

    文章利用从临床搜集的胰腺导管腺癌(PDAC)病人样本,通过LASSO算法及Cox回归分析,构建5分子预后模型,同时利用生存曲线、ROC曲线和多变量Cox回归分析验证了该模型的预后价值,并评估该模型预测术后 在多变量分析中,5分子预测模型是唯一重要的预后指标。此外,该预测模型与传统的临床病理变量相结合,可以大大提高其长期生存的预测能力。 此外,与临床病理特征不同,该5分子预测模型是唯一的在3类数据中均为独立预后因素的因素(表1)。 ? 在根据上述临床病理参数分层的大多数癌症亚组中,5分子预测模型也可有效区分不同的DSS(图3)。 5分子预测模型显示出更强的预测能力,与单个基因预测相比,AUC和HR高得多(图4a、b)。与主要的临床病理因素相比,该预测模型似乎在某些方面具有优势,尽管这并不明显优于N期和组织学分级。 此外,与单独的临床病理因素相比,单独的临床病理变量和该预测模型的组合显示出更好的预测能力(图4d)。因此,本文推测5分子预测模型可以为临床病理特征增加明显的预后价值。 ? ? ? ?

    84910发布于 2020-07-15
  • 来自专栏脑电信号科研科普

    EEG脑电公开数据库大盘点

    对于刚进入EEG领域的同学来说,利用网上公开的EEG数据库练练手,顺便发表一些论文是个不错的选择。 公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 EEG/ MEG/MRI/ fNIRS公开数据库大盘点》),但最近笔者又搜罗了不少EEG的公开数据库网站,因此在这篇推文里笔者把目前的EEG公开数据库进行了较为全面的总结,希望对大家有所帮助。 网址:https://headit.ucsd.edu/studies 5.TUH EEG Corpus 包含大量病人(如癫痫病人)的EEG数据,样本量达到12000。 isip.piconepress.com/projects/tuh_eeg/html/downloads.shtml 6.PhysioNet PhysioNet于1999年在美国国立卫生研究院(NIH)的主持下成立,其提供大量的生理和临床数据以及相关的开源软件来

    4.2K20编辑于 2022-05-02
  • 来自专栏科研菌

    5+分思路:非编码RNA结合临床预后进行分析

    BLCA患者的临床特征 作者再次排除了34例没有缺少TNM分期和年龄等临床特征数据的患者,随机定义剩下一半患者为”primary dataset“,而整体患者为”entire dataset“,两组间临床特征无显著性差异 图5. 而对于IV期患者,高/低风险组的生存期没有显著差别(图5A-C)。按年龄进行分层分析时,高低风险组也仅在大于65岁的亚群中有显著差异(图5D-E)。 4. 用列线图预测5年总生存期的校准图 D图:(数据集:primary dataset) 用列线图预测3年总生存期的校准图 E图:(数据集:primary dataset) 用列线图预测5年总生存期的校准图 5. 列线图以及其单个因素的生存预测能力 ? 图7.

    79020发布于 2020-06-29
  • 来自专栏深度学习与python

    Pinecone 无服务器向量数据库公开预览

    作者 | Renato Losio 译者 | 明知山 策划 | 丁晓昀 最近,Pinecone 宣布了其新的无服务器向量数据库的公共预览,旨在降低基础设施管理成本,同时提高生成式人工智能应用的准确性 根据向量数据库专家的说法,读、写和存储的分离显着降低了各种规模和类型的工作负载的开销。多租户计算层使用新的索引和检索算法实现了按需检索,从而实现了对 blob 存储进行内存高效的向量搜索。 在“重新构想向量数据库,实现知识丰富的 AI”一文中,Pinecone 工程副总裁 Ram Sriharsha 描述了团队为何以及如何重建 Pinecone,并讨论了向量数据库的重要作用: LLM 很容易产生幻觉 Ampt 的 CEO 兼创始人 Jeremy Daly 则表示: 它被吹捧为 "遏制 AI 幻觉的突破性进展",但考虑到其他主要数据库也正在添加向量功能,分析人士表示,其接受者可能会很少。 Pinecone 并不是市场上唯一支持无服务器向量存储的参与者,其他数据库和数据平台供应商也提供了支持向量的无服务器数据库,包括 MongoDB 和 Snowflake。

    64810编辑于 2024-02-29
  • 来自专栏脑电信号科研科普

    EEG MEGMRI fNIRS公开数据库大盘点

    《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》   公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 此外,我们个人同样可以利用各类脑科学公开数据库方便地进行各种研究。 笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,希望对大家的研究有所帮助。 网址:http://myconnectome.org/wp/ 中国AD临床前期联盟多中心认知下降纵向研究数据库   中国AD临床前期联盟多中心认知下降纵向研究数据库(SILCODE)是由中国国家老年疾病临床医学研究中心 (NDAR),与精神疾病相关的国家临床试验数据库(NDCT),研究领域标准数据库(RDoC db)和NIH小儿MRI数据存储库等。 从内容上来说,该数据库数据内容丰富,包含临床、影像学,基因组等方面的数据。

    4.1K01发布于 2020-11-18
  • 来自专栏科研菌

    如何用好公开数据库多种组学数据?

    对基因组学、表观基因组学、转录组学和临床信息的综合分析有助于鉴定特定的分子亚组并发现胰腺癌的新生物标志物。 二.分析流程 ? 图4.胰腺癌中DNA拷贝数变异与甲基化异常频率之间的相关性 5.胰腺癌亚群的临床病理特征和免疫评分 作者进一步分析了iC1和iC2 / iC3 / iC4亚组之间的临床病理信息。 图5A-B:除CD8 T细胞外,iC1亚组B细胞CD4 T细胞,嗜中性粒细胞,巨噬细胞和树突状细胞中的免疫评分均显著高于的其他三个亚组。 图5C:免疫特征分析还显示,与其他三组相比,iC1亚组在巨噬细胞调节,淋巴细胞浸润特征,IFN-γ反应和TGF-β反应方面得分更高。 使用来自GEO数据库的外部GSE21501和GSE71729数据集来验证结果。 最后,在外部和内部数据集中选择了三个与胰腺癌预后相关的基因(GRAP2,ICAM3和A2ML1)。

    2.2K11发布于 2020-08-07
  • 来自专栏百味科研芝士

    基于SEER数据库临床预测模型轻松发3分SCI

    今天继续和大家分享一篇临床预测模型文章,同样是基于SEER数据库的一篇预测模型,于2019年11月发表在Annals of Translational Medicine(IF=3.689)上。 of prognostic nomogram for young patients with gastriccancer 标题:建立并验证青年胃癌患者预后的预测模型 文章总体概览: 作者通过检索SEER数据库 此外,作者建立了3年及5年的校准曲线,结果表明列线图预测的生存率(包括OS及CSS)与实际生存率具有较高的一致性,见图5(此推送仅展示OS结果,CSS类似)。 图5. 校准曲线(OS) ? 图6. DCA结果 笔者总结:本文通过SEER数据库建立了青年胃癌患者OS和CSS的预后预测模型,并进行了验证。 通过统计学分析+R语言技术建立了临床适用性较强的Nomogram。

    4.8K33发布于 2020-02-24
  • 来自专栏Techo

    5月抽奖活动已结束,获奖人员名单公布】Techo Youth高校公开数据库专场

    通栏760_90.jpg 参与方式: 1、观看Techo Youth5月高校开发者公开课 2、每期由老师定制三个关键词,直播讲课期间老师公布“关键词” 3、同学们关注“腾讯云数据库”公众号,分别回复关键词 ,即可参加抽奖活动 【活动已结束】 ==5月Techo Youth高校公开课腾讯云数据库专场抽奖活动名单公布== 活动时间:5月13日、5月20日、5月27日,共三期 活动奖励:25Q币、Techo周边大礼包

    695151发布于 2021-06-07
  • 来自专栏Android开发指南

    5.数据库

    5.数据库 数据库的操作 创建数据库create database mydb ; 查看创建数据库的语句show create database mydb ; 改变当前的数据库use mydb ; 删除数据库 drop database mydb ; 查看所有的数据库show databases ; 修改数据库mydb1的字符集为utf8 alter database mydb1 character set ,先创建数据库,再获取可读可写的数据库对象,如果数据库存在,就直接打开,增删改用这个 SQLiteDatabase db = oh.getWritableDatabase(); //如果存储空间满了 数据库常用操作 用到数据库就要想到 数据库单例,保证只要一个实例 定义javaben对象 将Javaben对象存到数据库数据库读取 实例: CoolWeatherOpenHelper public 使用这种方式来维护数据库的升级,不管版本怎样更新,都可以保证数据库的表结构是最新的,而且表中的数据也完全不会丢失了。

    90980发布于 2018-05-14
  • 来自专栏生信技能树

    TCGA数据库| 如何将表达矩阵与样本临床数据进行合并?

    前面我们已经给大家介绍过TCGA数据库中样本barcode的详细组成:TCGA样本barcode详细介绍,现在我们来看看如何将基因表达矩阵与样本临床信息进行合并,方便后续做 比如生存分析,基因在不同样本分期 TARGET-AML" "MATCH-Z1I" "HCMI-CMDC" "MATCH-W" # [5] ) ## 再次加载 load("TCGA-BRCA.transcriptome.Rdata") ls() names(assays(data)) rowdata <- rowData(data) 5、 ("tcga_mrna_fpkm_symbol.rds") head(colnames(mrna_fpkm)) # [1] "symbol_mrna" "TCGA-5L-AAT0 -01A-12R-A41B-07" "TCGA-A2-A04U-01A-11R-A115-07" "TCGA-AN-A04A-01A-21R-A034-07" # [5] "TCGA-A7-A13D-01A

    1.8K12编辑于 2025-01-08
  • 来自专栏全栈程序员必看

    普林斯顿公开课 算法1-5:算法理论

    算法复杂度用于定义问题的难度,另外也有助于开发最优化的算法,算法复杂度能够通过分析最坏情况来降低输入数据对算法性能的影响。

    37120编辑于 2022-07-09
  • 来自专栏木鸟杂记

    数据库实习一定要刷公开课吗?

    有同学在分布式系统&数据库论坛[1]问如何找到一个数据库实习。我感觉很多想做基础软件方向的在校同学可能都会有类似问题,所以开个小文简单聊聊。 最近两年我观察到一些风气:在简历上堆公开课项目。 我在各个平台也鼓吹过刷题和公开课,当然,以后我也仍会继续鼓吹。但在继续之前我想借此机会澄清下,刷题和公开课虽好,但这只是一种手段而不是目的。 如果我们把公开课当做一种开阔视野、领域进阶的一种手段,就不会去比拼公开课的数量,抄代码来完成实验,而是去扎实听讲、研读论文,搞清楚该学科的研究主旨和知识脉络。 因为以我和周围同事数据库面试校招的经验来说,大家对于实习生和校招生等新人,还是比较看重基本功和软技能。 最后小结下,对于公开课,在精而不在多;对于刷题,是手段而不是目的。

    67720编辑于 2022-12-07
  • 来自专栏机器之心

    临床PK完胜ChatGPT-5!国内团队造出首个OCT影像AI系统

    腔内影像中不同技术与分辨率的对比示意图 在这项纳入了 96 名患者、160 处病变的临床研究中,团队构建了一个严苛的竞技场:将 CA-GPT 系统、ChatGPT-5 以及拥有 1-5 年经验的初级介入医师放在同一维度下 评估涵盖 10 项预设决策指标,分为术前规划 5 项和术后评估 5 项,每项一致得 1 分,总分 0-5 分。 支架长度选择:CA-GPT 准确率达 80.6%,ChatGPT-5 仅为 54.2%。 但此次发布的 CA-GPT 系统及其临床成果,标志着中国企业在高端腔内影像领域开始掌握定义权。 不做通用大模型的「套壳」,而是深耕垂直场景的「窄门」。 这或许就是中国医疗科技的「DeepSeek 时刻」—— 把 AI 技术落地业务场景,用自己的技术,解决最真实的临床痛点。

    24510编辑于 2025-12-18
  • 来自专栏媒矿工厂

    5G+8K示范项目技术方案—2019法网公开

    图1 用于2019年法网公开赛的相机 在2019年法国网球公开赛期间,法国电视台使用Orange部署的试用5G本地网络,向连接的电视和移动设备展示了8K视频直播。 5G是ITU-T开发的一种新的传输标准,可以提供非常高的速度(高达1Gbps)。对于法网公开赛8K实验,目标是250Mbps。 编码比特预算 这里为不同的编码器定义了以下目标: 表1 在2019法网公开赛中的8k实验 ? 图3 数据中心 视频处理工作流程摘要 图4在一个图中展示了部署在2019年法网公开赛上的平台所支持的所有不同工作流程。 ? 图11 用于通过5G网络生产8K的设备 结论 该项目在法网公开赛开赛前2个月开始。该系统在不到一周的时间内在法国电视台和Orange上演。

    1.8K30发布于 2019-08-06
领券