首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序随笔

    聊聊ChatGLM-6B医疗数据微调

    参考了多个医疗模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。 开源库下载 在服务器上通过git一键下载即可: ChatGLM-6B下载 直接在服务器上,通过魔塔社区的sdk下载代码一键下载即可: 我加了一句代码打印出下载地址,然后通过mv命令拷贝到指定路径下 #模型下载 from modelscope import snapshot_download model_dir = snapshot_download('ZhipuAI/ChatGLM-6B') print (model_dir) 指令数据集准备 数据集的格式严格参考开源库的格式,这里的格式直接参考/data/xxx.json数据格式即可。 {"instruction": "一名患者因腹胀、纳差等症状就诊,检查发现肝、腹水及肝功能损害,诊断为肝淀粉样变性,请问该患者应该接受哪些治疗方案?"

    72110编辑于 2024-03-17
  • MediGo医疗模型数据开发平台 八场景赋能智慧医疗全流程

    然而,医疗AI的发展正面临算法进步与数据生产力滞后的突出矛盾。澳鹏MediGo平台通过八应用场景和七维技术矩阵,构建了从数据生产到模型训练的全链路解决方案,有望显著提升医疗AI模型的准确性和可靠性。 澳鹏Appen(中国)今日正式发布MediGo医疗模型数据开发平台,这一创新性平台旨在解决医疗AI领域面临的数据标注精度不足、多模态协同处理效率低下等核心挑战。 该平台的推出标志着医疗AI数据服务进入专业化、智能化新阶段,将为医疗AI的临床应用提供强有力的数据支撑。 八场景赋能智慧医疗全流程在诊疗场景方面,平台基于深度学习的病理图片智能分析系统能够自动标注病灶区域,帮助生成结构化诊断报告,显著提升诊断效率。 在数据安全方面,平台支持医疗级私有化部署方案,兼容企业内网环境,确保敏感医疗数据的安全流转。同时,基于医疗知识图谱的智能检索系统和版本控制系统,为数据管理提供了专业化的解决方案。

    30310编辑于 2025-06-24
  • 来自专栏机器学习AI算法工程

    医疗语言模型:CareGPT

    CareGPT (关怀GPT)是一个医疗语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。 ,能够批量生成各种用于构建知识库和微调的数据; 聚合了丰富的开源医学LLM、LLM训练的医学数据、LLM部署资料、LLM测评以及相关LLM的资源整理; 我们参与了医学LLM的CMB榜单评测-IvyGPT ,在测试中,我们领先ChatGPT及一众开源医学LLM 数据集 预训练数据 LLM-Pretrain-FineTune/data_pretrain MedicalGPT/pretrain zysj TCM-Ancient-Books 数据集配置、PT、SFT、RW数据格式 dataset_info 如果您使用自定义数据集,请务必在 dataset_info.json 文件中以如下格式提供您的数据集定义。 PT example data .txt格式,一行一个无监督数据

    84910编辑于 2024-06-08
  • 来自专栏人工智能

    人工智能在医疗行业的6最新进展

    图片来源网络 盘点人工智能在医疗行业的6最新进展,主要集中在新药研发、疾病诊断两领域。 BERG的平台利用其开发的人工技能技术,可以对高通量的分子和临床信息进行数据驱动分析。它能从分散、庞大的数据里头提取出可执行的洞见,这一方法也已得到了验证。 2、两大计算机网络助力葛兰素史克研发新药 美国癌症研究所有一项触目惊心的数据:每10名美国人中,就有4名会在一生里被诊断有癌症。其中,有三分之一的患者无法活过5年。 6、病发数年前预知阿兹海默病 意大利巴里大学(University of Bari)的研究人员用MRI扫描了67名志愿者的大脑,其中一些罹患阿兹海默病,一些轻度认知障碍患者,以及一些普通健康人。 亿欧智库根据当前大数据、人工智能、区块链三项技术在保险行业的落地情况撰写了《大数据、人工智能、区块链的行业落地——2017中国保险科技报告》,希望通过本次研究来探究保险行业的发展过往、业态特点,以及前沿科技中大数据

    1.2K80发布于 2018-01-30
  • 来自专栏PPV课数据科学社区

    数据医疗领域的七应用

    ★原文翻译★ 大数据的意义在于提供“见解”:从不同来源收集信息,然后分析信息,以揭示用其他方法发现不了的趋势。在利用大数据发掘价值的所有行业中,医疗行业有可能实现最大的回报。 这只是大数据医疗领域的众多应用之一。以下是大数据医疗行业的一些常见用途,包括商业运作和健康管理: 1. 分析电子病历:医生共享电子病历可以收集和分析数据,寻找能够降低医疗成本的方法。 医生和医疗服务提供商之间共享患者数据,能够减少重复检查,改善患者体验。 利用大数据分析,按照过往记录、图表信息和患者特点,医院能识别高风险病人,并提供必要的护理,从而降低再入院率。 6. 利用大数据,该诊所能分析2200余种医疗过程。因此,它能简化工作流程,把某些临床任务从医生转移到护士手上,减少不必要的检查,提高患者满意度。和其他行业一样,大数据指明了从哪里入手可以改善医疗过程。

    1.4K60发布于 2018-04-23
  • 来自专栏程序你好

    数据科学的前6语言

    2012年的《哈佛商业评论》(Harvard business review)正确地将数据科学列为“21世纪最性感的工作”。即使在这份报告发表6年后的今天,《商业评论》仍被证明是正确的。 随着人工智能和机器学习的出现,“数据科学”一词在精通技术的人中间流行起来。用最简单的话说,数据科学是一种利用科学技术和算法从数据中挖掘知识的方法,无论是结构化的还是非结构化的。 无论您是数据科学领域的新手还是专业人士,您需要记住的一些基本内容包括分析数据、应用编程工具(如对数据进行序列和选择)以及执行简单的数据可视化。 R R编程语言被数据挖掘人员和数据科学家广泛用于分析数据。简化工作在统计学家中也很流行。R提供了强大的面向对象编程工具,使其在其他计算语言中处于优势地位。静态图形使图形和其他数学符号的生成更加容易。 SQL 结构化查询语言(SQL)用于处理大型数据库。特别是,它有助于管理结构化数据。学习SQL可以很好地提高数据科学家的语言技能。这种语言的缺点是缺乏可移植性。

    1.2K30发布于 2018-09-29
  • 来自专栏企鹅号快讯

    数据人工智能在医疗领域将大有可为,医疗健康大数据论坛咖共话未来

    2017年12月1日,由上海大数据联盟主办,2017中国大数据人工智能创新创业大赛组委会、健盟协办的“2017中国(上海)大数据产业创新峰会医疗健康大数据论坛”在上海宝华万豪酒店顺利举办。 席间多位领域专家咖就论坛主题进行了深入地探讨,既吸引了业内专业人士的热情参与,又吸引了众多场外观众积极地收看直播。 ,国内首次联手医疗机构提供实际医疗场景AI创业赛,首次提供6实际医疗场景,提供珍贵的骨骼X线图片数据集,对接医院实际紧迫需求等。 ,解读大数据人工智能技术在健康医疗领域的发展与创新应用。 (照片为:下半场圆桌论坛嘉宾进行深入探讨) 医疗健康大数据作为国家重要基础战略资源,正迎来爆发式增长,规模巨大的诊疗数据、患者行为感官数据、研发数据和支付医保数据等快速增加,我国市场前景良好。

    1.3K00发布于 2017-12-27
  • 来自专栏Soul Joy Hub

    达尔文——生物医疗科学领域模型

    根据美国医学会的数据,医学专科已经超过180个,导致医学知识的分散和碎片化。 数据分散罕见:病历、药物信息、试验结果数据的分散性使得生物医疗领域难以综合和比较不同的数据。 蛋白质等等)也用于“达尔文”模型(通用开源数据以外)进一步的预训练,赋予“达尔文”模型在生物医疗领域比一般通用模型具备更有竞争力的表现 2.2 科研强化 RLHF 是指"Reinforcement 就在前些天,6月28日,在2023火山引擎V-Tech体验创新科技峰会上,火山引擎发布模型服务平台“火山方舟”。 “火山方舟” 包含模型广场、模型体验、模型训练推荐以及模型应用的功能,其使命是加速模型和算力的应用落地,加快模型在各行业发挥商业价值。 带给大家一个好消息,“达尔文”模型将入驻火山引擎模型生态,上架至“火山方舟”的模型广场,补全火山引擎模型生态的生物医疗领域,并供大家使用与反馈。 火山方舟 3.

    96530编辑于 2023-07-21
  • 来自专栏HyperAI超神经

    医疗健康工具汇总】国内首个医疗专科推理数据集;paperai可分析医学数据集;上海 AI 实验室开源医疗模型群

    * Ersilia:传染病和被忽视疾病模型中心 * 上海 AI 实验室开源医疗模型群「浦医 2.0」 * 国内首个医疗专科推理数据集 RJUA-QA 开源 * paperai :医学/科学文献发现和审阅引擎 资源地址: https://github.com/ersilia-os/ersilia 上海 AI 实验室开源医疗模型群「浦医 2.0」 近日,上海 AI 实验室与上海交通大学医学院附属瑞金医院等合作伙伴联合发布医疗多模态基础模型群 「浦医 2.0」 (OpenMEDLab2.0),实现了医疗模型群「产、学、研、用、评」一站式开源,旨在为「跨领域、跨疾病、跨模态」的 AI 医疗应用提供能力支持。 资源地址: github.com/OpenMEDLab 国内首个医疗专科推理数据集 RJUA-QA 开源 蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的方式, 推出了首个中文医疗专科问答推理数据集 RJUA-QA,数据集由训练、验证、测试三部分组成,包含 2,132 个 QA 问答对,Context 来自于中国泌尿外科和男科疾病诊断治疗指南。

    77410编辑于 2024-06-04
  • 来自专栏数据猿

    报告 | 2016年8月数据投融资分析报告 ——医疗数据促进中国医疗体制改革

    根据不完全统计,2016年8月数据行业共计发生33起投融资事件,相比上个月环比增长57%,其中已披露具体金额的有29起,涉及金额13.9亿人民币。 目前中国政府也大力促进医疗数据的发展,2016年6月下旬,《国务院办公厅关于促进和规范健康医疗数据应用发展的指导意见》(国办发〔2016〕47号)的出台,对医疗数据的发展带来有利的政策保障,具有里程碑意义 2、医疗数据提升医疗系统的效率 医疗数据的应用不局限于各医院的数据,也包括医疗保险系统的数据、卫生管理部门的数据,药品管理部门的数据、病人和医生的数据等。 3、医疗数据有效减少医疗事故 电子健康/医疗记录数据,能够促进服务供应商和医疗机构之间的数据全面分享。 整体来说,在政府部门的政策促进下,医疗数据在未来几年的发展值得期待,医疗数据的发展也将给中国现有医疗体系带来重大改变。 注:2016年8月数据领域投融资列表 ?

    95790发布于 2018-04-20
  • 来自专栏企鹅号快讯

    基层医疗破局关键:从医疗SaaS三未来趋势说起

    【从安全万家说说医疗SaaS终究应该怎样玩】 安全不仅在医疗保险职业中具有多年累积的线上线下共同优势,并且在转型中还不断将大数据、云核算等技能才能落地于详细事务,彻底有资历充任探究医疗晋级的排头兵。 在治疗过程中,“云诊所”系统可以自动识别电子病历内容,结合大数据及AI才能,给出辅佐建议和个性化治疗思路,为经历不行丰厚的底层医师供给外部支持。 【底层医疗破局要害:从医疗SaaS三趋势说起】 我在传统企业转型培训课“重立异”中提出,用互联网的技能、方法论和价值观,去重构(留意不是推翻)传统职业,构建“进口模式”的新商业形状,这是我国当时经济最大的亮点 : 榜首,数据无缝化。 未来医疗SaaS必定不止停留在电子处方、线上就医、在线付出等单一流程功能的信息化上,而是将线上、线下全面打通,数据进口无缝化,患者和治疗组织不必忧虑数据对接错位的问题,然后可以建立起全面的笔直数据库,促进现代医学和治疗技能的前进

    1K70发布于 2018-01-25
  • 来自专栏大数据文摘

    数据推进个性化医疗的五原因

    ,由于与医疗保健相关,已经出现在个性化医疗革命的中心。 美国Definiens公司是生命科学领域里,对生物标志物诊断和医疗保健行业的定量数字化病理图像分析和数据挖掘解决方案的领先供应商。 该公司的首席执行官,托马斯黑德勒,和我们探讨了大数据推进个性化医疗事业的五原因。 1. 能解开未知 科技可以帮助我们从实验样品和活组织切片中获取大量的数据。 能关联多种诊断信息来源并制定治疗方案 来自临床结果、遗传图谱和组织形态的大数据分析将是个性化医学的一动力。随着我们对来自不同来源的数据对比整合,为每个患者量身定制治疗方案也将成为可能。 3. 病人病理样本的数据化,也就是从定性样品中提取多次离散数据点,就会产生广阔数据量,以便用来进行统计分析,并迅速做出切实可行的临床诊断和治疗建议。 4.

    54250发布于 2018-05-22
  • 来自专栏CDA数据分析师

    【CDAS 2017】大数据与生物医疗分论坛: 智能数据,健康医疗

    CDAS 2017中国数据分析师行业峰会的上午大数据与生物医疗分论坛中,来自北京大学第三医院、微软等六位专家与教授,分享了大数据在生物医疗行业的实践和应用。 人工智能在医疗数据中的应用 峰瑞资本早期项目负责人 谭验 谭验谭总从各行业数据化程度入手,探讨了医疗数据的来源与应用,讲述了AI在制药中的应用,以及数据分析驱动下的医保控费,谭总在分享中还提到如何制定个性化解决方案 大数据助力临床医学研究应用 北京大学第三医院骨科秘书长 吴云霞 医疗数据在临床医学研究中的应用是政府、医院、社会、医师及患者共同关注的问题,吴云霞以实际案例为依托,系统论述作为医务工作者如何理解医疗数据 健康医疗数据的建立与应用 经纶世纪医疗网络技术(北京)有限公司创始人&总裁 余中 打造健康医疗数据驱动的智慧健康医疗服务是当今全球各国关注的重点,是人工智能在健康医疗行业进行深度融合和创新变革的最富有广阔前景的领域 AI/大数据与健康和医学的未来 微软(中国)有限公司产品经理 王大禹 王大禹简述了国内外流行的健康医疗领域大数据及AI技术的应用,通过对医疗健康领域四类最有代表性的数据——基因组数据、临床信息数据、图像数据和健康信息的分析总结出对于每一类数据最合适的处理

    1.3K100发布于 2018-02-26
  • 医疗模型,巨头们的新赛场

    正因如此,百度、腾讯等互联网大厂积累下来了大量医疗数据,这些数据积累使其推出专业的医疗模型产品成为可能。 得益于此,微脉、卫宁健康都积累下来了海量的、高质量的医疗数据,这些数据无疑是模型产品的优质训练数据集,能够帮助二者训练出精准度更高、可靠性更强的医疗模型产品。 为了避免此类情况的发生,发力于此的厂商们必须保持审慎的态度,不断打磨产品本身,以提升模型产品的能力。二是,医疗数据的隐私性高、数据处理难度医疗模型的训练不易。 众所周知,由于医疗数据往往涉及患者本身,因此具备很高的私密性,但模型能力的训练又需要大量数据为支撑,对研发医疗模型的厂商来说,数据的获得有着比较高的难度。 不仅如此,由于数据标准不一,医疗行业的数据处理同样难度较高,需要医疗模型厂商多下功夫。

    45310编辑于 2024-04-15
  • 来自专栏CDA数据分析师

    数据分析不能碰的6禁区!

    1 没有明确分析数据的 要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据。只有明确了目的之后,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。 2 没有合理安排时间 数据分析也要合理安排时间,一般有几个步骤,收集数据、整理数据、分析数据、美化表格。在做这些之前,要预估每一个步骤需要花多少时间,哪一步比较重要,需要花更多的时间等。 数据分析重点应该在于分析,应该以最快的速度收集完数据,才有更多的时间整理和分析,最后经过分析的数据才是最有价值的。 5 不懂得分析哪些数据 这是比较普遍的问题,收集了数据后不知道要分析哪些项目,哪些数据点才能体现出分析的目的。 6 表格不美观,不清晰 做数据分析一般使用的是excel表格记录,一份美观清晰的表格不仅使我们可以清楚的看到这份数据的重点,方便查到所想要的数据。在收集数据的过程中,也可以提高收集和分析数据的效率。

    71160发布于 2018-02-11
  • 来自专栏机器学习/数据可视化

    Python入门-6数据类型操作

    Python的6数据类型操作总结 本文对Python中常见6数据类型的操作进行了汇总: Numbers(数字) String(字符串) List(列表) Tuple(元组) Dictionary(字典 = 1.3常用函数 取绝对值:abs 四舍五入:round 取整:int 转浮点数:float 二、字符串String 字符串是Python中常见的数据类型之一,能够使用str函数将其他类型的数据强制转成字符类型 2.1键盘输入 终端中通过input函数输入的任何内容都是字符串数据 2.2三种方法生成 通过3种方法生成字符串数据: 单引号:`python` 双引号:“python” 三引号:一般字符串内容较长时使用 列表元素重复:* 返回列表中的最值(比较ASCII码):max、min 3.3常见操作 索引和切片操作(类比字符串) append:将整体追加到列表的末尾 extend:列表中的每个元素进行合并,组成一个的列表 ,字典是无序的数据类型,主要是用来存放具有一定映射关系的数据

    71220编辑于 2023-08-23
  • 来自专栏华章科技

    数据分析不能碰的6禁区

    没有明确分析数据的目的 要分析一个数据,首先要明确自己的目的,为什么要收集和分析这样一份数据。只有明确了目的之后,才能够把握好接下来应该收集哪些数据,应该怎么收集数据,应该分析哪些数据等。 没有合理安排时间 数据分析也要合理安排时间,一般有几个步骤,收集数据、整理数据、分析数据、美化表格。在做这些之前,要预估每一个步骤需要花多少时间,哪一步比较重要,需要花更多的时间等。 数据分析重点应该在于分析,应该以最快的速度收集完数据,才有更多的时间整理和分析,最后经过分析的数据才是最有价值的。 不懂得分析哪些数据 这是比较普遍的问题,收集了数据后不知道要分析哪些项目,哪些数据点才能体现出分析的目的。 表格不美观,不清晰 做数据分析一般使用的是excel表格记录,一份美观清晰的表格不仅使我们可以清楚的看到这份数据的重点,方便查到所想要的数据。在收集数据的过程中,也可以提高收集和分析数据的效率。

    36430发布于 2018-08-13
  • 来自专栏灯塔大数据

    6数据人物浅谈未来三年数据的发展

    新工具,新视角 维珍传媒(Virgin Media)洞察分析部负责人马克·查普曼(Mark Chapman) (维珍传媒:英国第一家通信、电视全业务运营商,欧洲最大的移动虚拟网络运营商,也是英国第二付费电视公司 大数据相关技术在不断改进,现在我们可以通过大数据对我们的行业进行深度分析和发掘,而不是像之前一样收集“便宜又大包的黄页式”数据库。 我认为企业利用的数据类型将发生重大变化,不论是内部数据的开源数据集,还是社交媒体等产生的非结构性数据集,这些数据类型都将发生巨变。 数据整合是成功关键 联合利华信息分析副总裁柯尔斯顿·穆迪(Kjersten Moody) (联合利华:跨国消费品公司,总部设在荷兰鹿特丹和英国伦敦,世界第三消费品公司,世界上最大的涂抹食品生产商,最古老的跨国公司之一 联合利华目前专注于整合不同渠道数据,对客户数据体验进行重新定义,建立互动性更高的数据联系。这样一来,我们就能让客户深度发掘数据信息,并做出正确的行动决策。 翻译:灯塔大数据

    93180发布于 2018-04-08
  • 来自专栏pandas

    Pandas数据应用:医疗数据分析

    引言在医疗领域,数据分析对于改善患者护理、优化资源分配以及支持医学研究至关重要。 Pandas是一个强大的Python库,专为数据操作和分析而设计,它提供了高效的数据结构和数据分析工具,是进行医疗数据分析的理想选择。常见问题及解决方案1. 数据导入与预处理在开始任何分析之前,首先需要将数据导入到Pandas中。通常,医疗数据以CSV、Excel或数据库表的形式存储。 import matplotlib.pyplot as plt# 绘制年龄分布直方图plt.figure(figsize=(10, 6))plt.hist(df['age'], bins=20, edgecolor 希望本文的内容能够为从事医疗数据分析的朋友们提供一些帮助。

    83320编辑于 2025-01-03
  • 来自专栏数据派THU

    如何挖掘医疗数据?看这份KDD2021《异构医疗数据挖掘》教程

    来源:专知 本文约1000字,建议阅读5分钟 在本教程中,我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征。 [ 导读 ]ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是世界数据挖掘领域的最高级别的学术会议,由 ACM 的数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机协会推荐为 A 来自华为的研究人员在PSU上给出关于异构医疗数据挖掘的教程,非常值得关注! 随着异构医疗数据和先进的机器学习和数据挖掘技术(特别是深度学习方法)的爆炸式发展,我们现在有机会在医疗保健领域有所作为。 在本教程中,我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征。上半部分将用于介绍挖掘结构化医疗数据方面的最新进展,包括计算表型、疾病早期检测/风险预测和治疗建议。 在下半部分,我们将专注于针对非结构化医疗数据的挑战,并介绍自动化ICD编码的高级深度学习方法、可理解的医学语言翻译、临床试验挖掘和医学报告生成。

    61410编辑于 2023-03-29
领券