首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大数据文摘

    【基因有话说】医疗数据到底该不该公开

    公开医疗数据的价值 医疗信息涵盖许多,包括CT、核磁共振、血液检测、基因检测结果,接种经历,医生诊断,手术视频……这些数据是典型的“整体大于部分之和”,至少,对科技型创业者Jonathan Hirsch (via 奇点网geekheal.com) 既然以搭建医疗数据网络或向病人公开医疗数据的方式是有用的,那么接下来就是如何实现的问题了。 那些开放医疗数据的机构 ? 公开医疗数据的阻力在哪? 公开医疗数据这一概念在推行过程中遇到的阻力既有来自医生的,也有来自医院的。但这些阻力并非无法可解。 医生担心会提高沟通成本。 但据悉,在公开病历活动试运行的一年期间,在105名医疗参与者中,只有3%的人认为自己花费了更多时间去向病人解答问题。 公开数据其实会帮助医务人员记载正确的数据。 (Via Accenture.com) 公开数据,在让你有更多健康知情权利。套用Keating的话说,“下一代人活在一个数据时代,他们当然想要接触到自己的医疗数据”。

    91140发布于 2018-05-23
  • 来自专栏程序随笔

    聊聊ChatGLM-6B医疗数据微调

    参考了多个医疗大模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。 开源库下载 在服务器上通过git一键下载即可: ChatGLM-6B下载 直接在服务器上,通过魔塔社区的sdk下载代码一键下载即可: 我加了一句代码打印出下载地址,然后通过mv命令拷贝到指定路径下 #模型下载 from modelscope import snapshot_download model_dir = snapshot_download('ZhipuAI/ChatGLM-6B') print @zhihu: https://www.zhihu.com/people/LiuCongNLP # @contact: logcongcong@gmail.com # @time: 2023/12/6

    72110编辑于 2024-03-17
  • 来自专栏用户7627119的专栏

    公开数据单细胞挖掘6+分思路

    然后结合弹性网络回归和KM分析在不同肿瘤类型中确定了155个预后相关基因,并构建了癌症特异性预后免疫评分模型,最后使用了五种肿瘤的免疫检查点封锁疗法的公开数据进行模型验证。 Immune Checkpoint Therapies 实体瘤中癌症特异性免疫预后特征及其与免疫检查点治疗的关系 http://mpvideo.qpic.cn/0bf2n4bvuaad3mahbugq6vpvg36dljxqgwqa.f10002 接下来,作者在独立的患者队列中验证了模型,使用相同的公式计算了GBM患者在Repository of Molecular Brain Neoplasia Data (Rembrandt)(一个大型公共脑瘤数据库数据 作者在已发表的文献中收集了十个公开的癌症患者数据集(抗PD1/PDL1治疗的黑色素瘤,膀胱尿路上皮癌,肾细胞癌,胃癌和非小细胞肺癌)。

    71430编辑于 2022-09-21
  • 来自专栏从百草园到三味书屋

    公开重症监护数据库MIMIC代码仓库介绍

    MIMIC Code Repository: Enabling reproducibility in critical care research》论文 引言 科学结果的可重复性越来越受到关注; 医疗领域进入数字化革命 (本文是2017年接收),引出形成MIMIC-III数据库; EHR二次分析需要临床专家和数据科学家的合作,在EHR数据库上推导或者定义一些概念是需要资源的,对于没有特别强的临床背景或者数据科学技能的人来说巨大障碍 ; 该文介绍MIMIC代码仓库,介绍与重症相关概念的导出以及相关假设条件等; 公开数据已经逐渐有了,公开相应的数据代码同样重要。 疾病严重程度评分Severity of illness scores 在回顾性数据库中难以计算 大多都是在前瞻性实验中获取的; 常规收集的数据缺相应元素。 to selecting a study cohort an outline of the data-capture process 社区 让研究人员和数据维护人员、临床人员共同提升代码 结论 公开数据库的案例已经不少

    2.1K10编辑于 2023-03-09
  • 来自专栏脑电信号科研科普

    EEG脑电公开数据库大盘点

    对于刚进入EEG领域的同学来说,利用网上公开的EEG数据库练练手,顺便发表一些论文是个不错的选择。 公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 EEG/ MEG/MRI/ fNIRS公开数据库大盘点》),但最近笔者又搜罗了不少EEG的公开数据库网站,因此在这篇推文里笔者把目前的EEG公开数据库进行了较为全面的总结,希望对大家有所帮助。 网址:https://isip.piconepress.com/projects/tuh_eeg/html/downloads.shtml 6.PhysioNet PhysioNet于1999年在美国国立卫生研究院 网址:https://bcmi.sjtu.edu.cn/~seed/index.html 21.HCI Tagging database 30名被试的EEG数据,被试观看电影和图片,同时使用6个摄像机、

    4.2K20编辑于 2022-05-02
  • 来自专栏深度学习与python

    Pinecone 无服务器向量数据库公开预览

    作者 | Renato Losio 译者 | 明知山 策划 | 丁晓昀 最近,Pinecone 宣布了其新的无服务器向量数据库的公共预览,旨在降低基础设施管理成本,同时提高生成式人工智能应用的准确性 根据向量数据库专家的说法,读、写和存储的分离显着降低了各种规模和类型的工作负载的开销。多租户计算层使用新的索引和检索算法实现了按需检索,从而实现了对 blob 存储进行内存高效的向量搜索。 在“重新构想向量数据库,实现知识丰富的 AI”一文中,Pinecone 工程副总裁 Ram Sriharsha 描述了团队为何以及如何重建 Pinecone,并讨论了向量数据库的重要作用: LLM 很容易产生幻觉 Ampt 的 CEO 兼创始人 Jeremy Daly 则表示: 它被吹捧为 "遏制 AI 幻觉的突破性进展",但考虑到其他主要数据库也正在添加向量功能,分析人士表示,其接受者可能会很少。 Pinecone 并不是市场上唯一支持无服务器向量存储的参与者,其他数据库和数据平台供应商也提供了支持向量的无服务器数据库,包括 MongoDB 和 Snowflake。

    64810编辑于 2024-02-29
  • 来自专栏脑电信号科研科普

    EEG MEGMRI fNIRS公开数据库大盘点

    《本文同步发布于“脑之说”微信公众号,欢迎搜索关注~~》   公开数据库对于促进科学研究的快速发展意义重大,公开数据的建立可以让全世界各国的领域内研究者对某些问题进行更深入更全面的研究。 此外,我们个人同样可以利用各类脑科学公开数据库方便地进行各种研究。 笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,希望对大家的研究有所帮助。 人脑连接组计划    大名鼎鼎的人脑连接组计划(Human Connectome Project, HCP),该公开数据库是由美国美国国立卫生研究院(NIH)负责,于2009年开始启动。 网址:https://www.ukbiobank.ac.uk/ 美国国家精神卫生数据档案研究所   美国国家精神卫生数据档案研究所(NDA)数据库整合了多个数据库的数据,包括美国国家自闭症研究数据库 网址:https://physionet.org/ 总结   笔者在这里较为全面地盘点目前免费的EEG/MEG/MRI/ fNIR公开数据库,这些数据库为科研人员提供了可供分析的海量数据,特别是对脑科学研究结果的可重复性验证以及大数据分析具有重要意义

    4.1K01发布于 2020-11-18
  • 来自专栏科研菌

    如何用好公开数据库多种组学数据?

    接着作GO富集分析发现,T细胞活化,淋巴细胞活化调节,免疫应答调节细胞表面受体信号传导途径等显著富集(图6D)。 图6A:iC2和iC4的CNV异常显著高于iC1和iC3,这表明CNV可能对胰腺癌的预后有一定影响; 图6B:但是,未观察到甲基化的显著差异。 图6C:从基因表达与甲基化和CNV之间的相关性分析,发现具有MetHypo的DEGs的基因表达水平更高,但在CNV之间未观察到类似的关系。 图6. iC1和其他三个亚组之间的817个共同差异表达基因以及四个亚组之间差异表达基因的CNV和MET变异特征 7.CNV,MET与基因表达之间的关系 为了进一步分析CNV,MET和基因表达之间的关系, 使用来自GEO数据库的外部GSE21501和GSE71729数据集来验证结果。 最后,在外部和内部数据集中选择了三个与胰腺癌预后相关的基因(GRAP2,ICAM3和A2ML1)。

    2.2K11发布于 2020-08-07
  • 来自专栏landv

    医疗数字阅片-医学影像-es6-Element.querySelector()

    [OHIF-Viewers]医疗数字阅片-医学影像-es6-Element.querySelector() https://developer.mozilla.org/zh-CN/docs/Web/API

    49820发布于 2020-07-13
  • YashanDB数据库医疗行业中的应用前景

    如何优化医疗行业数据的查询速度与处理效率一直是数据库技术应用中的关键问题。医疗行业数据量庞大且结构多样,涵盖患者信息、医疗记录、影像资料等多类型数据,需要高并发、高可靠的数据库系统支持。 在此背景下,选择具备高性能、强一致性及灵活部署能力的数据库系统成为提升医疗信息化水平的重要保障。 本文基于数据库技术行业标准,深入分析YashanDB在医疗行业的数据管理优势,为医药大数据的高效存取与处理提供技术方案。 事务控制与高可用性保障医疗数据安全医疗业务对数据一致性及系统可用性要求极高,YashanDB设计了强大的事务机制:多版本并发控制(MVCC)保证读写不阻塞,提升数据库并发能力和响应速度,满足高并发的医疗在线服务 医疗从业者和数据库技术人员应持续关注YashanDB新特性的演进,加强技术研发与实践应用,深化医疗信息系统的创新升级。

    23010编辑于 2025-09-25
  • 来自专栏mysql

    hhdb数据库介绍(6)

    在部署安装前或安装完成后请检查以下各项是否符合关系集群数据库使用要求,若不满足以下要求可能会给集群的运行带来不可预知的异常以及无法发挥集群的最佳性能。 内存 内存 1个计算节点≥30G 1个管理平台≥2G 1个配置库实例≥3G 一个存储节点实例≥60G 1个LVS实例≥6G net.ipv4.tcp_keepalive_probes 小于 6 sysdate-is-now 5.5版本及以下实例使用:select sysdate(),sleep(1),sysdate();5.5版本以上使用select sysdate(6) ,sleep(0.001),sysdate(6);测试要求两列时间相同 实例磁盘空间 实例数据目录绝对路径

    23810编辑于 2025-03-07
  • 来自专栏科研菌

    5+分新思路:公开数据库+简单实验验证!

    作者通过构建PD-L2特定靶点的珠芯片,并利用TCGA数据库中的相关数据来进行相关性分析和p-value分析,发现了PD-L2甲基化→mRNA表达量变化→黑色素瘤病人存活率变化的具体途径和机制。 图5 6.PD-L2甲基化和mRNA表达量显著影响了黑色素瘤患者的生存率 作者对不同CpG位点和mRNA表达量分组,研究了每一组对应的患者生存率(图6)。 结果发现:cg07211259的高甲基化对应着患者的低生存率(p=0.02)(这是因为cg07211259与mRNA表达量负相关)(图6a);mRNA的高表达量对应着患者的高生存率(p=0.03)(图6b 图6 小结 在本篇文章中,作者首先发现了PD-L2甲基化可以影响黑色素瘤患者的生存率,并依此展开研究。

    68410发布于 2020-12-08
  • GBase 数据库医疗行业中的应用与优化

    一、医疗数据管理的挑战医疗行业正快速进入数字化时代,患者信息、药物研发数据、设备监控数据等各类信息爆发式增长。 传统数据库无法满足医疗行业对数据安全、高效存储、实时分析的需求,而 GBase 数据库以其分布式架构和高效处理能力,为医疗行业提供了强大的技术支撑。二、GBase 数据库的核心优势1. 安全性与合规性– GBase 数据库内置多层数据加密与权限管理,完全符合 HIPAA 等国际医疗数据管理标准。3. 实时分析与预测– 提供高效的实时数据分析能力,适用于手术风险评估、疫情预测等场景。 针对高并发场景的优化– 在 GBase 数据库中开启读写分离机制,提高并发查询的性能。2. 建立多层索引体系– 对病历号、药品名称等常用查询字段建立复合索引,提升查询效率。3. 推动全球化医疗合作– 支持国际医疗研究数据的整合与分析,助力全球抗击疫情。

    44610编辑于 2024-11-27
  • YashanDB数据库医疗行业的应用实例与优势

    医疗行业数据处理面临着海量数据存储、实时访问、高并发处理和严格一致性保障的挑战。数据库系统作为关键支撑技术,需要在保证性能和稳定性的同时,支持复杂查询及高可用架构。 YashanDB作为一款高性能关系型数据库,具备多种部署形态和灵活的存储引擎,能有效应对医疗行业对数据处理的多样化需求。 本文针对医疗行业的业务特征,分析YashanDB的核心技术优势,旨在为行业内数据库选型、系统架构设计和性能优化提供技术参考。 多节点计算能力并行,适合医疗影像、电子病历等大数据在线分析。共享集群部署基于共享磁盘和共享缓存技术,实现多实例对同一数据库的高效并发访问。 访问控制与身份认证实现基于角色的访问控制(RBAC)和基于标签的行级安全(LBAC),并支持数据库认证和操作系统认证,保障数据访问的合法性和安全性。

    22810编辑于 2025-09-25
  • 来自专栏人工智能

    人工智能在医疗行业的6大最新进展

    图片来源网络 盘点人工智能在医疗行业的6大最新进展,主要集中在新药研发、疾病诊断两大领域。 在互相磨练后,这两款网络从公开数据库中的7200个化学分子里找到了不少潜在的抗癌新药,其中有60款已经被其他公司注册,这从侧面验证了这套系统的确能找到具有抗癌活性的分子。 6、病发数年前预知阿兹海默病 意大利巴里大学(University of Bari)的研究人员用MRI扫描了67名志愿者的大脑,其中一些罹患阿兹海默病,一些轻度认知障碍患者,以及一些普通健康人。

    1.2K80发布于 2018-01-30
  • 来自专栏iSharkFly

    Confluence 6 数据库 JDBC 驱动

    本页面提供了支持的数据库的所有 JDBC 驱动下载链接。 基于许可证的原因,我们没有将 MySQL 或 Oracle 的数据库驱动整合到 Confluence 中,因此你需要在 Confluence 启动之前手动下载和安装驱动。 添加你数据库驱动(MySQL 和 Oracle) 如果 Confluence 不能找到正确的数据库驱动的话,Confluence 配置向导将会在数据库配置步骤中停止进行。 希望你的数据库驱动能够在 Confluence 中使用: 停止 Confluence 下载和解压下面列表中需要的数据库驱动。 安装向导将会返回到数据库配置界面中,让你从这里开始下一步的数据库配置。

    1K20发布于 2019-01-31
  • 来自专栏iSharkFly

    Confluence 6 数据库驱动 原

    必须使用支持的数据库驱动。请参考 Database JDBC Drivers 页面来获得 Confluence 支持的数据库驱动。

    65040发布于 2019-01-30
  • 来自专栏木鸟杂记

    数据库实习一定要刷公开课吗?

    有同学在分布式系统&数据库论坛[1]问如何找到一个数据库实习。我感觉很多想做基础软件方向的在校同学可能都会有类似问题,所以开个小文简单聊聊。 最近两年我观察到一些风气:在简历上堆公开课项目。 我在各个平台也鼓吹过刷题和公开课,当然,以后我也仍会继续鼓吹。但在继续之前我想借此机会澄清下,刷题和公开课虽好,但这只是一种手段而不是目的。 如果我们把公开课当做一种开阔视野、领域进阶的一种手段,就不会去比拼公开课的数量,抄代码来完成实验,而是去扎实听讲、研读论文,搞清楚该学科的研究主旨和知识脉络。 因为以我和周围同事数据库面试校招的经验来说,大家对于实习生和校招生等新人,还是比较看重基本功和软技能。 最后小结下,对于公开课,在精而不在多;对于刷题,是手段而不是目的。

    67720编辑于 2022-12-07
  • 来自专栏landv

    医疗数字阅片-医学影像-es6解构赋值-const{}=-let{}=

    [OHIF-Viewers]医疗数字阅片-医学影像-es6解构赋值-const{}=-let{}= 解构赋值语法是一种 Javascript 表达式。

    42830发布于 2020-07-14
  • 来自专栏量子位

    姓名、病史、医疗影像通通泄露,500万人数据库没密码随便看,AI医疗暴露危机

    除此之外,医疗影像的存档数据库也缺乏相关的安全预防措施。总部位于丹佛的 Offsite Image 公布了超过34万种人类和动物相关的医疗记录的名称和其他详细信息。 这项法案在1996年颁布,紧随当时电子病例报告的东风,是医疗数据应用的奠基石。该法案明确提出,医疗健康服务的提供者和相关机构,对患者信息的隐私权承担法律责任。 近些年来,国内医疗领域的AI一直将影响分析作为关键的突破口,140多家医疗AI相关企业,120多家都在做医学影像相关业务。 一方面,除了肿瘤、免疫等特定疾病领域,很多其他疾病的影像数据集要么不公开,要么数据不完整。不成体系的数据体系阻碍了机器学习模型的训练,影响了AI影像产品的开发和完善。 想要建立一个安全性高的患者数据库,估计还有很长的一段路要走。

    95720发布于 2019-09-24
领券