首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏医学和生信笔记

    机器学习和临床预测模型公开课全文及回放

    周五公开课文字内容以及录屏回放。 视频已上传到b站,我的b站账号:阿越就是我 本文目录: 从医学统计到机器学习 机器学习在临床中的应用 机器学习和临床预测模型有什么关系? --孙振球,徐勇勇《医学统计学》第4版 机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率 唯一不同且是最重要的一点:临床预测模型更加注重结合临床背景进行解释。 生信常见的各种数据库id, hgnc gene symbol, entrez id, ensembl id等?中心法则?表观遗传涉及哪些内容?什么是甲基化?单核苷酸多态性SNP, 拷贝数变异CVN? 模型的解释:临床预测模型必须不能脱离临床,单纯的数字游戏没有任何意义。

    1.9K32编辑于 2023-02-14
  • 来自专栏医学数据库百科

    临床相关突变查询数据库

    写在前面 越来越多的研究发现某一个基因的突变和很多的临床特征有关系。如果我们想有查找临床性状和基因突变的关系的话,内容比较全面的就是ClinVar数据库了。 ClinVar 数据库是ncbi旗下用于查看临床相关突变的数据库。但是其数据库的内容比较多,而且检索界面不是很友好。所以经常看不懂其结果。所以今天就介绍一个检索简单的突变和表型的数据库。 通过其名字我们就知道这个是一个简易版的Clinvar数据库。 输入 数据库的输入很简单,我们可以数据疾病;基因名; 突变等。都可以。 我这里输入gastric cancer。 另外数据库也提供了下载的功能。我们点击Show Table就可以看到其下载结果的地方了。 写在后面 以上就是这个数据的所有功能的。输入关键词—界面友好的查看结果。是不是很简单。 一直再说这类汇总其他数据库的资源,最怕的资源更新慢的问题。不过看这个数据库还是经常更新的。所以可以放心使用的

    1.3K40发布于 2021-11-18
  • 来自专栏生信技能树

    TCGA数据库临床资料官方大全

    因为TCGA计划跨时太长,纳入研究的病人数量太多, 或多或少有点资料继续错误或者不完整,所以TCGA团队下功夫在计划结束后(April 2018)完整的系统性的公布了权威的临床资料。 下载链接:TCGA-CDR 看起来是乱码,但的确是真实的下载地址:https://api.gdc.cancer.gov/data/1b5f413e-a8d1-4d10-92eb-7c4ae739ed81 题外话:关于不同数据源的TCGA临床资料冲突的讨论 关于生存分析的冲突问题,我们多次讨论了: 集思广益-生存分析可以随心所欲根据表达量分组吗 寻找生存分析的最佳基因表达分组阈值 比如下面的代码比较两个数据源 /data/TCGA-HNSC.survival.tsv.gz',header = T)[,2:4] clin1$pid=substring(clin1[,2],1,12) head(clin1) clin1 clin3 = clin3[, -c(1:3)] 我在比较这两个文件的时候发现了不一致, 然后搜索解决方案居然找到了我以前华西医学院的学生的分享;https://www.jianshu.com/p/0a4a492b130e

    5.3K41发布于 2019-06-15
  • 来自专栏科研菌

    4+分临床回顾性研究深度分享

    非常简单的研究,竟然发在了4分+期刊。 所以分享给大家,感觉大家肯定能从中获得启发。 本研究回顾性地分析了德国六个中心住院患者的自然临床样本中与DILI相关的因素。 二、研究设计 ? 三、研究方法 1,受试者纳入标准 329名受试者来自德国4个联邦州的6家成人精神病诊所。 在4例患者中,联合使用抗抑郁药和抗精神病药物(奎硫平、奥氮平)与DILI风险相关,而在停用抗精神病药物或抗抑郁药-抗精神病药物后,水平正常化。 只要有完整的临床数据库,就可以做类似的研究。 临床启发 我们基本会在同一领域选择不同分段(影响因子)的文章分享给各位读者,比如近期分享的抑郁症相关系列(IF从4分到8分段不等)。 最关键的,这篇文章存在的问题太多,都能够发表到4分+期刊。你有什么理由说自己发不了SCI论文?

    1.8K31发布于 2020-12-29
  • 来自专栏生信宝典

    临床基因组分析相关数据库汇总

    一、人群SNV频率数据库 数据库名称 网站 简介 dbSNP https://www.ncbi.nlm.nih.gov/snp/ dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表 ClinGen https://www.clinicalgenome.org/ ClinGen是美国国立卫生研究院(NIH)资助的数据库资源,用于精准医学,研究基因和变异的临床相关性。 三、表型数据库 数据库名称 网站 简介 GeneReviews http://www.genereviews.org/ GeneReviews 是为忙碌的临床医生提供的国际即时护理资源,以标准化的期刊样式格式提供与遗传病相关的临床相关和医学上可操作的信息 DECIPHER https://www.deciphergenomics.org/ 使用Ensemble基因组浏览器,将基因芯片数据和临床表型进行关联,便于临床医生和研究人员使用的细胞分子遗传学数据库 七、其他数据库 数据库名称 网站 简介 Pharmgkb https://www.pharmgkb.org/ PharmGKB是一个综合资源,为临床医生和研究人员管理有关基因变异对药物反应影响的知识。

    2.7K20编辑于 2022-01-19
  • 来自专栏Android 开发者

    Android Q Beta 4 来啦!公开 API 也已定稿!

    您即刻就可以参加 Beta 测试计划,在 Pixel 设备上获取 Beta 4。 如果您已经参加了 Beta 测试计划并且已经在您的 Pixel 设备上运行 Beta 3 的话,它将会自动更新到 Beta 4。 加入了 Android Q Beta 项目的 Google 合作伙伴们也会在接下来的数周内将他们的设备更新到 Beta 4。 另外一个很重要的工作是测试应用在使用的受限制的非 SDK 接口,并切换到公开 SDK 或 NDK 的替代接口。 这使得您可以通过 Google Play 将应用更新推送给用户,并在用户的设备上测试应用的兼容性,包括那些运行 Android Q Beta 4 的设备。 如何获取 Beta 4? 获取步骤很简单!

    87730编辑于 2022-09-20
  • 来自专栏智药邦

    人工智能可以改变临床试验的4种方式

    然而,人工智能在实际临床试验过程中的采用仍处于早期阶段。与其他医疗保健领域相比,很少有初创公司直接针对临床试验领域的客户。目前,在临床试验的许多方面,对数字化的需求先于对人工智能的需求。 使用支持AI的数字健康技术和患者支持平台可以彻底改变临床试验,并在整个研究期间和研究终止后更成功地吸引和留住患者。 总之,应用人工智能可以减少临床试验周期,同时提高生产力和临床开发结果的成本。 AI有可能在四个关键领域改变临床试验 临床试验设计 生物制药公司正在采用一系列策略来创新试验设计。越来越多的科学和研究数据,例如当前和过去的临床试验、患者支持计划和上市后监测,为试验设计注入了活力。 大型科技公司和初创公司正在共同为未来更快、更有效的临床试验奠定基础。最终目标是通过在整个临床试验过程中采用人工智能来推动创新和更好的医疗保健。 参考资料 https://medcitynews.com/2021/12/4-ways-ai-can-transform-clinical-trials/ --------- End ---------

    1.2K20编辑于 2022-03-04
  • 来自专栏c2k2o6

    VNCTF2022公开赛-easyJ4va

    file(5) */ public class HelloWorldServlet extends HttpServlet { private volatile String name = "m4n_q1u

    81260编辑于 2022-02-15
  • 来自专栏从百草园到三味书屋

    公开重症监护数据库MIMIC代码仓库介绍

    ; EHR二次分析需要临床专家和数据科学家的合作,在EHR数据库上推导或者定义一些概念是需要资源的,对于没有特别强的临床背景或者数据科学技能的人来说巨大障碍; 该文介绍MIMIC代码仓库,介绍与重症相关概念的导出以及相关假设条件等 ; 公开数据已经逐渐有了,公开相应的数据代码同样重要。 疾病严重程度评分Severity of illness scores 在回顾性数据库中难以计算 大多都是在前瞻性实验中获取的; 常规收集的数据缺相应元素。 血管加压药物使用 CRRT 脓毒症sepsis sepsis定义有多种版本,这里给出了Angus 2001,Martin 2003,Iwashyna 2014三个版本 共病Comorbidities 给出了4个版本 结论 公开数据库的案例已经不少,为了让研究更加透明,也需要公开相应数据分析和数据处理的代码 补充 代码库地址:https://github.com/MIT-LCP/mimic-code 之前以MIMIC-III

    2.1K10编辑于 2023-03-09
  • 来自专栏大史住在大前端

    Stanford公开课《编译原理》学习笔记(1~4课)

    www.github.com/dashnowords/blogs 博客园地址:《大史住在大前端》原创博文目录 华为云社区地址:【你要的前端打怪升级指南】 B站地址:【编译原理】 Stanford公开课 :【Stanford大学公开课官网】 课程里涉及到的内容讲的还是很清楚的,但个别地方有点脱节,任何看不懂卡住的地方,请自行查阅经典著作《Compilers——priciples, Techniques 手动实现分词器 至此1-4课就结束了,估计看视频课程的人也是一脸懵逼,因为课程并没有讲解如何利用DFA得到最终期望的形式——Token元组,那么最后我们就自己手动来实现一下。 3.1 基本定义 假设我们需要对下面这段代码进行分词解析: let snippet = ` var b3 = 2; a = 1 + ( b3 + 4); return a; `; 那么先来进行一些基本类型集合定义

    96020发布于 2019-09-23
  • 来自专栏脑电信号科研科普

    EEG脑电公开数据库大盘点

    对于刚进入EEG领域的同学来说,利用网上公开的EEG数据库练练手,顺便发表一些论文是个不错的选择。 公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 EEG/ MEG/MRI/ fNIRS公开数据库大盘点》),但最近笔者又搜罗了不少EEG的公开数据库网站,因此在这篇推文里笔者把目前的EEG公开数据库进行了较为全面的总结,希望对大家有所帮助。 网址:https://www.bbci.de/competition/ 4.HeadIT HeadIT是加州大学圣地亚哥分校 Swartz 计算神经科学中心 (SCCN) 的一个项目,HeadIT的目标是存储和提供完全注释的原始数据文件 isip.piconepress.com/projects/tuh_eeg/html/downloads.shtml 6.PhysioNet PhysioNet于1999年在美国国立卫生研究院(NIH)的主持下成立,其提供大量的生理和临床数据以及相关的开源软件来

    4.2K20编辑于 2022-05-02
  • 来自专栏深度学习与python

    Pinecone 无服务器向量数据库公开预览

    作者 | Renato Losio 译者 | 明知山 策划 | 丁晓昀 最近,Pinecone 宣布了其新的无服务器向量数据库的公共预览,旨在降低基础设施管理成本,同时提高生成式人工智能应用的准确性 根据向量数据库专家的说法,读、写和存储的分离显着降低了各种规模和类型的工作负载的开销。多租户计算层使用新的索引和检索算法实现了按需检索,从而实现了对 blob 存储进行内存高效的向量搜索。 在“重新构想向量数据库,实现知识丰富的 AI”一文中,Pinecone 工程副总裁 Ram Sriharsha 描述了团队为何以及如何重建 Pinecone,并讨论了向量数据库的重要作用: LLM 很容易产生幻觉 Ampt 的 CEO 兼创始人 Jeremy Daly 则表示: 它被吹捧为 "遏制 AI 幻觉的突破性进展",但考虑到其他主要数据库也正在添加向量功能,分析人士表示,其接受者可能会很少。 Pinecone 并不是市场上唯一支持无服务器向量存储的参与者,其他数据库和数据平台供应商也提供了支持向量的无服务器数据库,包括 MongoDB 和 Snowflake。

    64810编辑于 2024-02-29
  • 来自专栏脑电信号科研科普

    EEG MEGMRI fNIRS公开数据库大盘点

    《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》   公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 此外,我们个人同样可以利用各类脑科学公开数据库方便地进行各种研究。 笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,希望对大家的研究有所帮助。 网址:http://myconnectome.org/wp/ 中国AD临床前期联盟多中心认知下降纵向研究数据库   中国AD临床前期联盟多中心认知下降纵向研究数据库(SILCODE)是由中国国家老年疾病临床医学研究中心 (NDAR),与精神疾病相关的国家临床试验数据库(NDCT),研究领域标准数据库(RDoC db)和NIH小儿MRI数据存储库等。 从内容上来说,该数据库数据内容丰富,包含临床、影像学,基因组等方面的数据。

    4.1K01发布于 2020-11-18
  • 来自专栏科研菌

    如何用好公开数据库多种组学数据?

    4.胰腺癌中DNA拷贝数变异与甲基化异常频率之间的相关性 5.胰腺癌亚群的临床病理特征和免疫评分 作者进一步分析了iC1和iC2 / iC3 / iC4亚组之间的临床病理信息。 表3. iC1和iC2 / iC3 / iC4亚组之间临床特征的比较 接下来,作者使用TIMER工具来计算四个亚组的免疫评分。 表3. iC1和iC2 / iC3 / iC4亚组之间临床特征的比较 6.胰腺癌亚组分子特征的比较 为了分析四个亚组之间的不同分子特征,作者分别计算了iC1和iC2 / iC3 / iC4之间的差异表达基因 使用来自GEO数据库的外部GSE21501和GSE71729数据集来验证结果。 最后,在外部和内部数据集中选择了三个与胰腺癌预后相关的基因(GRAP2,ICAM3和A2ML1)。 图8.在iC1和iC2 / iC3 / iC4亚组之间具有显著差异的前50个突变基因 小结 在文章中作者分析了161例胰腺癌样本的CNV、MET、RNA-Seq(mRNA)表达水平以及相应的临床信息。

    2.2K11发布于 2020-08-07
  • 来自专栏深度强化学习实验室

    【RLChina2020公开课课件】 Lecture-4.pdf

    lectures/lecture2.pdf https://rlchina.org/lectures/lecture3.pdf https://rlchina.org/lectures/lecture4.

    51410发布于 2020-08-02
  • 来自专栏百味科研芝士

    基于SEER数据库临床预测模型轻松发3分SCI

    今天继续和大家分享一篇临床预测模型文章,同样是基于SEER数据库的一篇预测模型,于2019年11月发表在Annals of Translational Medicine(IF=3.689)上。 of prognostic nomogram for young patients with gastriccancer 标题:建立并验证青年胃癌患者预后的预测模型 文章总体概览: 作者通过检索SEER数据库 作者同时建立了3年及5年的ROC曲线并描述了其对应的AUC值,均表现出来较好的区分度(AUC: 0.725-0.793),见图4。 图4. ROC曲线 ? 图5. 校准曲线(OS) ? 图6. DCA结果 笔者总结:本文通过SEER数据库建立了青年胃癌患者OS和CSS的预后预测模型,并进行了验证。 通过统计学分析+R语言技术建立了临床适用性较强的Nomogram。

    4.8K33发布于 2020-02-24
  • 来自专栏科研菌

    5+分新思路:公开数据库+简单实验验证!

    作者通过构建PD-L2特定靶点的珠芯片,并利用TCGA数据库中的相关数据来进行相关性分析和p-value分析,发现了PD-L2甲基化→mRNA表达量变化→黑色素瘤病人存活率变化的具体途径和机制。 不同行表示mRNA表达量和CpG位点;不同列表示不同种类的免疫细胞 4.PD-L2甲基化通过影响mRNA的表达,从而影响IF-γ的表达 已知IF-γ是黑色素瘤的预后和预测因素。 作者对mRNA表达量和IF-γ进行了相关性分析,又对CpG位点IF-γ进行了相关性分析(图4)。 图4 5.PD-L2甲基化通过影响IF-γ的表达,从而影响了PD-L2蛋白质的表达 作者用IF-γ对细胞系进行了72h处理,结果发现:PD-L2甲基化显著影响了PD-L2蛋白表达(p=

    68410发布于 2020-12-08
  • 来自专栏FreeBuf

    Log4Shell漏洞公开披露前,至少已在“在野”9天

    根据Security Affairs网站最新消息,Log4j库中的Log4Shell漏洞公开披露前,至少已经被攻击利用了一周之多。黑客组织也早已滥用该漏洞,大肆部署恶意软件。 漏洞存在很多可攻击点 漏洞披露后,NetLab 360研究人员声称,其公司旗下的Anglerfish和Apacket蜜罐已经被试图使用Log4Shell漏洞的网络攻击击中。 漏洞端倪早已显现 Cloudflare首席执行官Matthew Prince发表推文称,情况可能比最初设想的还要糟糕,12月10日漏洞公开披露前,该漏洞至少已经被攻击了一个多星期。 参考文章 https://securityaffairs.co/wordpress/125567/hacking/log4shell-log4j-exploitation.html

    74520编辑于 2021-12-15
  • 来自专栏生信技能树

    TCGA数据库| 如何将表达矩阵与样本临床数据进行合并?

    前面我们已经给大家介绍过TCGA数据库中样本barcode的详细组成:TCGA样本barcode详细介绍,现在我们来看看如何将基因表达矩阵与样本临床信息进行合并,方便后续做 比如生存分析,基因在不同样本分期 GDCdownload(query=query, files.per.chunk= 50, directory = "./") 下来后的数据为一个样本一个tsv文件:如 8d1641ea-7552-4d23 -9298-094e0056386a.rna_seq.augmented_star_gene_counts.tsv 4、整合成一个表达矩阵: ## 整理数据并存储为 R对象 GDCprepare(query 先看看各自的样本ID名,根据前面的介绍《TCGA样本barcode详细介绍》,可以看到 表达矩阵里面的是样本ID,临床信息中是patient ID,一个病人可能会取多个样本,比如同时存在正常样本与肿瘤样本 # 设置显著性线的位置高度 size=0.8, # 修改线的粗细 textsize = 4,

    1.8K12编辑于 2025-01-08
  • 来自专栏科研菌

    仅用公开数据集发4+分纯生信数据挖掘

    ,并结合临床特征进行富集分析评估分类器的预测能力,为临床侵袭性乳腺癌的诊断提供帮助。 因此,作者接下来用4种降维方法(MRMD,mRMR,PCA和FA)筛选特征构建分类器,表1展示了4种方法筛选的CpG位点数目。 ? 结果表明(表1),4个分类器对正常样本的预测精度高达96.9%,和训练集预测精度几乎一致。然而,4个降维方法对BRCA侵袭性的预测结果均出现明显的差异。 作者又结合了一些转移相关的临床特征来评估分类器,用超几何分布检验证实预测样本是否与一些临床特征有关,如肿瘤的T期、N期、HER2状态及淋巴结转移(LN+),这些指标都反映高侵袭性。 图1.两个肿瘤群中临床指标的富集分析结果 4.侵袭性和非侵袭性组的甲基化差异 富集分析结果表明,MRMD降维的分类器预测能力最佳,保留了134个差异甲基化位点(表1),因此作者进一步聚焦于这134个CpG

    65110发布于 2020-11-23
领券