首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习/数据可视化

    数据平滑9妙招

    今天给大家分享9常见数据平滑方法:移动平均Moving Average指数平滑Exponential Smoothing低通滤波器多项式拟合贝塞尔曲线拟合局部加权散点平滑LoessKalman滤波小波变换 它对最近的数据点给予较高的权重,而对较早的数据点给予较低的权重。这使得EMA更适合用于追踪快速变化的数据。 指数平滑的主要特点包括:加权平滑:指数平滑使用指数权重来平滑数据。较新的数据点获得更高的权重,而较旧的数据点获得较低的权重。这意味着它对最近的数据更为敏感,从而更好地捕获了数据的最新趋势。 7, 8, 9])y = np.array([10, 8, 7, 6, 5, 4, 3, 2, 1])# 三阶多项式拟合degree = 3coefficients = np.polyfit(x, y 数据平滑:Savitzky-Golay滤波器旨在平滑数据,减小数据中的高频噪声和突发波动。它保留了数据中的趋势和主要特征,同时去除了噪声。

    6K44编辑于 2023-10-13
  • MediGo医疗模型数据开发平台 八场景赋能智慧医疗全流程

    然而,医疗AI的发展正面临算法进步与数据生产力滞后的突出矛盾。澳鹏MediGo平台通过八应用场景和七维技术矩阵,构建了从数据生产到模型训练的全链路解决方案,有望显著提升医疗AI模型的准确性和可靠性。 澳鹏Appen(中国)今日正式发布MediGo医疗模型数据开发平台,这一创新性平台旨在解决医疗AI领域面临的数据标注精度不足、多模态协同处理效率低下等核心挑战。 该平台的推出标志着医疗AI数据服务进入专业化、智能化新阶段,将为医疗AI的临床应用提供强有力的数据支撑。 八场景赋能智慧医疗全流程在诊疗场景方面,平台基于深度学习的病理图片智能分析系统能够自动标注病灶区域,帮助生成结构化诊断报告,显著提升诊断效率。 在数据安全方面,平台支持医疗级私有化部署方案,兼容企业内网环境,确保敏感医疗数据的安全流转。同时,基于医疗知识图谱的智能检索系统和版本控制系统,为数据管理提供了专业化的解决方案。

    30310编辑于 2025-06-24
  • 来自专栏机器学习AI算法工程

    医疗语言模型:CareGPT

    CareGPT (关怀GPT)是一个医疗语言模型,同时它集合了数十个公开可用的医疗微调数据集和开放可用的医疗语言模型,包含LLM的训练、测评、部署等以促进医疗LLM快速发展。 ,能够批量生成各种用于构建知识库和微调的数据; 聚合了丰富的开源医学LLM、LLM训练的医学数据、LLM部署资料、LLM测评以及相关LLM的资源整理; 我们参与了医学LLM的CMB榜单评测-IvyGPT ,在测试中,我们领先ChatGPT及一众开源医学LLM 数据集 预训练数据 LLM-Pretrain-FineTune/data_pretrain MedicalGPT/pretrain zysj TCM-Ancient-Books 数据集配置、PT、SFT、RW数据格式 dataset_info 如果您使用自定义数据集,请务必在 dataset_info.json 文件中以如下格式提供您的数据集定义。 PT example data .txt格式,一行一个无监督数据

    84910编辑于 2024-06-08
  • 来自专栏PPV课数据科学社区

    数据医疗领域的七应用

    ★原文翻译★ 大数据的意义在于提供“见解”:从不同来源收集信息,然后分析信息,以揭示用其他方法发现不了的趋势。在利用大数据发掘价值的所有行业中,医疗行业有可能实现最大的回报。 这只是大数据医疗领域的众多应用之一。以下是大数据医疗行业的一些常见用途,包括商业运作和健康管理: 1. 分析电子病历:医生共享电子病历可以收集和分析数据,寻找能够降低医疗成本的方法。 医生和医疗服务提供商之间共享患者数据,能够减少重复检查,改善患者体验。 大数据分析能够对患者的原始数据进行标准化整合,用以充实公共健康记录,而丰富多样的公共健康记录能催生更合理的法规,并提供更好的医疗。 4. 利用大数据,该诊所能分析2200余种医疗过程。因此,它能简化工作流程,把某些临床任务从医生转移到护士手上,减少不必要的检查,提高患者满意度。和其他行业一样,大数据指明了从哪里入手可以改善医疗过程。

    1.4K60发布于 2018-04-23
  • 来自专栏企鹅号快讯

    数据人工智能在医疗领域将大有可为,医疗健康大数据论坛咖共话未来

    2017年12月1日,由上海大数据联盟主办,2017中国大数据人工智能创新创业大赛组委会、健盟协办的“2017中国(上海)大数据产业创新峰会医疗健康大数据论坛”在上海宝华万豪酒店顺利举办。 席间多位领域专家咖就论坛主题进行了深入地探讨,既吸引了业内专业人士的热情参与,又吸引了众多场外观众积极地收看直播。 ,国内首次联手医疗机构提供实际医疗场景AI创业赛,首次提供6实际医疗场景,提供珍贵的骨骼X线图片数据集,对接医院实际紧迫需求等。 ,解读大数据人工智能技术在健康医疗领域的发展与创新应用。 (照片为:下半场圆桌论坛嘉宾进行深入探讨) 医疗健康大数据作为国家重要基础战略资源,正迎来爆发式增长,规模巨大的诊疗数据、患者行为感官数据、研发数据和支付医保数据等快速增加,我国市场前景良好。

    1.3K00发布于 2017-12-27
  • 来自专栏数据科学与人工智能

    数据】银行业9数据科学应用案例

    以下我们罗列银行业使用的数据科学用例清单,让您了解如何处理大量数据以及如何有效使用数据。 1 欺诈识别 2 管理客户数据 3 投资银行的风险建模 4 个性化营销 5 终身价值预测 6 实时和预测分析 7 客户细分 8 推荐引擎 9 客户支持 结论 1 欺诈识别 机器学习对于有效检测和防范涉及信用卡 这创建了TB级的客户数据,因此数据科学家团队的第一步是分离真正相关的数据9 客户支持 杰出的客户支持服务是保持与客户长期有效关系的关键。作为客户服务的一部分,客户支持是银行业中一个重要但广泛的概念。实质上,所有银行都是基于服务的业务,因此他们的大部分活动都涉及服务元素。 原文链接:https://activewizards.com/blog/top-9-data-science-use-cases-in-banking/ 版权声明:作者保留权利,严禁修改,转载请注明原文链接

    4K30发布于 2018-07-30
  • 来自专栏Soul Joy Hub

    达尔文——生物医疗科学领域模型

    根据美国医学会的数据,医学专科已经超过180个,导致医学知识的分散和碎片化。 数据分散罕见:病历、药物信息、试验结果数据的分散性使得生物医疗领域难以综合和比较不同的数据。 蛋白质等等)也用于“达尔文”模型(通用开源数据以外)进一步的预训练,赋予“达尔文”模型在生物医疗领域比一般通用模型具备更有竞争力的表现 2.2 科研强化 RLHF 是指"Reinforcement “火山方舟” 包含模型广场、模型体验、模型训练推荐以及模型应用的功能,其使命是加速模型和算力的应用落地,加快模型在各行业发挥商业价值。 带给大家一个好消息,“达尔文”模型将入驻火山引擎模型生态,上架至“火山方舟”的模型广场,补全火山引擎模型生态的生物医疗领域,并供大家使用与反馈。 火山方舟 3. 尽管在线智能问诊可以提供有用的信息,但它不是替代真正医疗专业人员的诊断和治疗。 线下导诊:线下智能导诊是指智能助手在医疗机构的实际场景中提供导诊服务。

    96530编辑于 2023-07-21
  • 来自专栏HyperAI超神经

    医疗健康工具汇总】国内首个医疗专科推理数据集;paperai可分析医学数据集;上海 AI 实验室开源医疗模型群

    * Ersilia:传染病和被忽视疾病模型中心 * 上海 AI 实验室开源医疗模型群「浦医 2.0」 * 国内首个医疗专科推理数据集 RJUA-QA 开源 * paperai :医学/科学文献发现和审阅引擎 资源地址: https://github.com/ersilia-os/ersilia 上海 AI 实验室开源医疗模型群「浦医 2.0」 近日,上海 AI 实验室与上海交通大学医学院附属瑞金医院等合作伙伴联合发布医疗多模态基础模型群 「浦医 2.0」 (OpenMEDLab2.0),实现了医疗模型群「产、学、研、用、评」一站式开源,旨在为「跨领域、跨疾病、跨模态」的 AI 医疗应用提供能力支持。 资源地址: github.com/OpenMEDLab 国内首个医疗专科推理数据集 RJUA-QA 开源 蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的方式, 推出了首个中文医疗专科问答推理数据集 RJUA-QA,数据集由训练、验证、测试三部分组成,包含 2,132 个 QA 问答对,Context 来自于中国泌尿外科和男科疾病诊断治疗指南。

    77410编辑于 2024-06-04
  • 来自专栏数据猿

    报告 | 2016年8月数据投融资分析报告 ——医疗数据促进中国医疗体制改革

    根据不完全统计,2016年8月数据行业共计发生33起投融资事件,相比上个月环比增长57%,其中已披露具体金额的有29起,涉及金额13.9亿人民币。 数据猿制图 从投融资领域的分布看,2016年8月,大数据技术应用领域发生20起投融资事件,其中,数据分析方向是最热得投资方向,共发生9起,其次为精准营销4起,风险管控3起,大数据工具3起,基础架构1起 2、医疗数据提升医疗系统的效率 医疗数据的应用不局限于各医院的数据,也包括医疗保险系统的数据、卫生管理部门的数据,药品管理部门的数据、病人和医生的数据等。 3、医疗数据有效减少医疗事故 电子健康/医疗记录数据,能够促进服务供应商和医疗机构之间的数据全面分享。 整体来说,在政府部门的政策促进下,医疗数据在未来几年的发展值得期待,医疗数据的发展也将给中国现有医疗体系带来重大改变。 注:2016年8月数据领域投融资列表 ?

    95790发布于 2018-04-20
  • 来自专栏灯塔大数据

    2015年数据行业的9关键词

    而国内,国家也将大数据纳入国策。 我们在年底盘点了2015年数据行业九关键词,管窥这一年行业内的发展。 2 国家政策——战略 今年中国政府对于大数据发展不断发文并推进,这标志着大数据已被国家政府纳入创新战略层面,成为国家战略计划的核心任务之一:2015年9月,国务院发布《促进大数据发展行动纲要》,大力促进中国数据技术的发展 与传统数据库相比,DBaaS能提供低成本、高敏捷性和高可扩展性等云计算特有的优点。 9 数据科学家——性感 ? 数据科学家能够通过统计变成涉及、开发和调用算法而支持业务决策;管理海量数据;可视化数据以辅助理解。 内容来源:36数据

    1.6K60发布于 2018-04-10
  • 来自专栏企鹅号快讯

    基层医疗破局关键:从医疗SaaS三未来趋势说起

    【从安全万家说说医疗SaaS终究应该怎样玩】 安全不仅在医疗保险职业中具有多年累积的线上线下共同优势,并且在转型中还不断将大数据、云核算等技能才能落地于详细事务,彻底有资历充任探究医疗晋级的排头兵。 一起,为了重建大众与底层诊所之间的良性衔接,安全万家与国际威望医疗质量效劳系统认证组织JCI、DNV GL医疗集团联合研发了我国底层医疗组织认证规范系统——万家认证规范,从9个方面(专评),推动底层医疗规范化 【底层医疗破局要害:从医疗SaaS三趋势说起】 我在传统企业转型培训课“重立异”中提出,用互联网的技能、方法论和价值观,去重构(留意不是推翻)传统职业,构建“进口模式”的新商业形状,这是我国当时经济最大的亮点 : 榜首,数据无缝化。 未来医疗SaaS必定不止停留在电子处方、线上就医、在线付出等单一流程功能的信息化上,而是将线上、线下全面打通,数据进口无缝化,患者和治疗组织不必忧虑数据对接错位的问题,然后可以建立起全面的笔直数据库,促进现代医学和治疗技能的前进

    1K70发布于 2018-01-25
  • 来自专栏大数据文摘

    数据推进个性化医疗的五原因

    ,由于与医疗保健相关,已经出现在个性化医疗革命的中心。 美国Definiens公司是生命科学领域里,对生物标志物诊断和医疗保健行业的定量数字化病理图像分析和数据挖掘解决方案的领先供应商。 该公司的首席执行官,托马斯黑德勒,和我们探讨了大数据推进个性化医疗事业的五原因。 1. 能解开未知 科技可以帮助我们从实验样品和活组织切片中获取大量的数据。 能关联多种诊断信息来源并制定治疗方案 来自临床结果、遗传图谱和组织形态的大数据分析将是个性化医学的一动力。随着我们对来自不同来源的数据对比整合,为每个患者量身定制治疗方案也将成为可能。 3. 病人病理样本的数据化,也就是从定性样品中提取多次离散数据点,就会产生广阔数据量,以便用来进行统计分析,并迅速做出切实可行的临床诊断和治疗建议。 4.

    54250发布于 2018-05-22
  • 来自专栏CDA数据分析师

    【CDAS 2017】大数据与生物医疗分论坛: 智能数据,健康医疗

    CDAS 2017中国数据分析师行业峰会的上午大数据与生物医疗分论坛中,来自北京大学第三医院、微软等六位专家与教授,分享了大数据在生物医疗行业的实践和应用。 人工智能在医疗数据中的应用 峰瑞资本早期项目负责人 谭验 谭验谭总从各行业数据化程度入手,探讨了医疗数据的来源与应用,讲述了AI在制药中的应用,以及数据分析驱动下的医保控费,谭总在分享中还提到如何制定个性化解决方案 大数据助力临床医学研究应用 北京大学第三医院骨科秘书长 吴云霞 医疗数据在临床医学研究中的应用是政府、医院、社会、医师及患者共同关注的问题,吴云霞以实际案例为依托,系统论述作为医务工作者如何理解医疗数据 健康医疗数据的建立与应用 经纶世纪医疗网络技术(北京)有限公司创始人&总裁 余中 打造健康医疗数据驱动的智慧健康医疗服务是当今全球各国关注的重点,是人工智能在健康医疗行业进行深度融合和创新变革的最富有广阔前景的领域 AI/大数据与健康和医学的未来 微软(中国)有限公司产品经理 王大禹 王大禹简述了国内外流行的健康医疗领域大数据及AI技术的应用,通过对医疗健康领域四类最有代表性的数据——基因组数据、临床信息数据、图像数据和健康信息的分析总结出对于每一类数据最合适的处理

    1.3K100发布于 2018-02-26
  • 医疗模型,巨头们的新赛场

    正因如此,百度、腾讯等互联网大厂积累下来了大量医疗数据,这些数据积累使其推出专业的医疗模型产品成为可能。 得益于此,微脉、卫宁健康都积累下来了海量的、高质量的医疗数据,这些数据无疑是模型产品的优质训练数据集,能够帮助二者训练出精准度更高、可靠性更强的医疗模型产品。 为了避免此类情况的发生,发力于此的厂商们必须保持审慎的态度,不断打磨产品本身,以提升模型产品的能力。二是,医疗数据的隐私性高、数据处理难度医疗模型的训练不易。 众所周知,由于医疗数据往往涉及患者本身,因此具备很高的私密性,但模型能力的训练又需要大量数据为支撑,对研发医疗模型的厂商来说,数据的获得有着比较高的难度。 不仅如此,由于数据标准不一,医疗行业的数据处理同样难度较高,需要医疗模型厂商多下功夫。

    45110编辑于 2024-04-15
  • 来自专栏博文视点Broadview

    数据中台建设的9误区,你中了几条?

    目前,行业对数据中台存在诸多误解和理解偏差,因此在建设数据中台的过程中,错误的理解可能导致数据中台建设的失败。 下图为数据中台建设的9误区,下面详细介绍每个误区。 图  数据中台建设的9误区 01. 数据中台等同于数据工具的集合 数据工具的集合能有效地提高数据开发和使用的效率,实现让数据易用的目标。 因此,数据工具是数据中台建设的中间产物,而非终极目标。 02. 数据中台等同于数据平台 数据平台是数据中台的一部分功能,是实现数据好用的核心能力和基础设施。 建设数据中台是一项体系性工程,耗时长,花费,用人多,需要企业自上而下推动,需要企业勠力同心,才能实现数据中台的真正价值。 活动方式:关注下方“博文视点Broadview”公众号,在后台回复“数据中台抽奖”参与活动,届时会在参与的小伙伴中抽取1名幸运鹅! 活动时间:截至9月15日(周三)开奖。

    39210编辑于 2023-05-06
  • 来自专栏PPV课数据科学社区

    【译文】数据科学家必须具备的9能力

    【陆勤看点】如何认识和理解数据科学家?一种很好的方法就是查看数据科学家职位的描述,即数据科学家在公司中负责什么?数据科学家需要什么样职能要求?本文是一个数据科学部门招聘数据科学家的描述,值得一看。 数据科学部门正在寻找有热情应用统计学、机器学习和分析从数据集中获得洞见的数据驱动人。 在数据科学部门中,我们通过把那些最优秀数据工程师和数据科学家召集在一起,并让他们帮助我们的顾客从它们的数据中提取他们所需的相关信息。 6、回复“答案”查看hadoop面试题题目及答案 7、回复“爱情”查看大数据与爱情的故事 8、回复“笑话”查看大数据系列笑话 9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载 专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

    80150发布于 2018-04-20
  • 来自专栏pandas

    Pandas数据应用:医疗数据分析

    引言在医疗领域,数据分析对于改善患者护理、优化资源分配以及支持医学研究至关重要。 Pandas是一个强大的Python库,专为数据操作和分析而设计,它提供了高效的数据结构和数据分析工具,是进行医疗数据分析的理想选择。常见问题及解决方案1. 数据导入与预处理在开始任何分析之前,首先需要将数据导入到Pandas中。通常,医疗数据以CSV、Excel或数据库表的形式存储。 数据清洗与转换医疗数据往往包含大量的噪声和异常值,需要进行清洗和转换,以确保后续分析的准确性。常见问题异常值影响统计结果。分类变量未进行编码。 希望本文的内容能够为从事医疗数据分析的朋友们提供一些帮助。

    83320编辑于 2025-01-03
  • 来自专栏数据派THU

    如何挖掘医疗数据?看这份KDD2021《异构医疗数据挖掘》教程

    来源:专知 本文约1000字,建议阅读5分钟 在本教程中,我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征。 [ 导读 ]ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是世界数据挖掘领域的最高级别的学术会议,由 ACM 的数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机协会推荐为 A 来自华为的研究人员在PSU上给出关于异构医疗数据挖掘的教程,非常值得关注! 随着异构医疗数据和先进的机器学习和数据挖掘技术(特别是深度学习方法)的爆炸式发展,我们现在有机会在医疗保健领域有所作为。 在本教程中,我们将介绍最先进的深度学习方法及其实际应用,特别关注于探索不同类型医疗数据的独特特征。上半部分将用于介绍挖掘结构化医疗数据方面的最新进展,包括计算表型、疾病早期检测/风险预测和治疗建议。 在下半部分,我们将专注于针对非结构化医疗数据的挑战,并介绍自动化ICD编码的高级深度学习方法、可理解的医学语言翻译、临床试验挖掘和医学报告生成。

    61410编辑于 2023-03-29
  • 来自专栏CDA数据分析师

    数据挖掘与数据建模的9定律(深度长文 收藏细读!)

    最简单的解释可以概括为“数据是困难的”,经常采用自动化减轻这个“问题”的数据获取、数据清理、数据转换等数据预处理各部分的工作量。 这是数据预处理重要的原因,并且在数据挖掘过程中占有如此的工作量,这样数据挖掘者可以从容地操纵问题空间,使得容易找到适合分析他们的方法。 有两种方法“塑造”这个问题空间。 第一种方法是将数据转化为可以分析的完全格式化的数据,比如,大多数数据挖掘算法需要单一表格形式的数据,一个记录就是一个样例。 有五种因素说明试验对于寻找数据挖掘解决方案是必要的: 数据挖掘项目的业务目标定义了兴趣范围(定义域),数据挖掘目标反映了这一点; 与业务目标相关的数据及其相应的数据挖掘目标是在这个定义域上的数据挖掘过程产生的 数据挖掘者应该在模型不损害业务理解和适应业务问题的情况下关注预测准确度、模型稳定性以及其它的技术度量。 9 变化律:所有的模式因业务变化而变化。 数据挖掘发现的模式不是永远不变的。

    1.8K50发布于 2018-02-11
  • 来自专栏集智书童

    医疗SAM也来啦 | AutoSAM告诉你如何在医疗领域更快更好开发模型

    为了评估作者的微调方法的标签效率,作者在有限的标签数据的公共医学图像分割数据集上比较了这3个预测Head的结果。 考虑到这些限制,本文提出了一种在医学图像数据集上微调SAM的直接方法,即冻结SAM编码器的权重,并在其上添加预测Head进行训练。冻结权重的原因是SAM是一个模型,并且大多数权重由编码器贡献。 2、相关工作 2.1、语言模型 在大型语言模型(LLM)出现之后,一些工作致力于在LLM中引入图像来完成多模态任务。例如,CLIP和ALIGN利用对比学习在嵌入空间中对齐网络图像及其标题。 2.2、为医学图像定制模型 这一系列工作主要集中在针对特定分割数据集微调SAM,因为SAM在医学图像上表现出显著的性能退化。 最后,作者在图5中绘制了使用更多标记数据进行微调的结果。作者发现,当标记的卷数小于10时,AutoSAM仅比UNet(没有额外信息)和SimCLR(在同一数据集上预训练的知识)具有优势。

    1.3K20编辑于 2023-09-04
领券