理想的实践开发人员和科学家准备将他们的技能应用于科学应用,如生物学,遗传学,和药物的发现,这本书介绍了几个深度网络原语。
药物发现的核心目标是找到能够有效调节目标生物过程,同时对其他过程几乎没有影响的治疗药物。 早期药物发现中需要新的、基于系统的方法 许多观察结果强调了在早期药物发现中需要新的、基于系统的方法: 分析多个药物发现项目的成功和失败得出的结论是,大量晚期临床失败的原因,是不正确或无效的生物学靶点。 本文将概述基于网络的疾病过程描述的概念基础,以及如何在这些基础上开发一个实用的药物发现方法。还将介绍以具体药物发现项目结果的形式进行的验证。 药物发现的目的是找到能够显著扰乱目标表型所依据的强大网络的药物。 4 网络驱动的药物发现 E-therapeutics公司基于前面概述的原则,开发了一种网络驱动的早期药物发现方法。
编译 | WJM 自1869 年第一个合成药物水合氯醛被发现以来,制药公司一直在激烈竞争以寻找下一个重磅药物。 但是当前的药物发现方法结合了现代计算、人工智能 (AI) 和机器学习 (ML),通常受到经典计算技术能力的限制。 此外,对于实验室中每确定10到20种药物,只有一种药物会到达患者手中,而其他药物则会在此过程中失败。一旦发现潜在的候选药物,将对其进行开发,以最大限度地提高整个人群的益处并最大限度地减少副作用。 但是,如果计算机可以加快药物发现过程,使药物更有可能有效并产生更少的副作用呢?如果它甚至可以为一个人量身定制药物,以最大限度地提高疗效并最大限度地减少反应,那会怎么样? 量子计算机已经开始为治疗方法的发现做出贡献,在接下来的几年里,人们可能会进入个性化医疗时代。 当前药物开发的问题 2020 年,FDA 批准了 53 种药物,是过去 20 年中批准药物数量最高的之一。
因此,发现具有高疗效和低毒性的抗胰腺癌药物至关重要,这也是肿瘤学界面临的最具挑战性的任务之一。 Para_02 药物组合已成为许多疾病的标准疗法,包括疟疾、HIV、结核病和癌症。 在临床环境中已经发现了有效的药物组合。 同时,越来越多的非临床研究致力于识别协同作用的药物对。 已批准的药物具有已知的毒性特征和大规模可获得性,是这些发现的理想候选药物。 Para_04 定量结构-活性关系(QSAR)建模是最受欢迎的计算药物发现方法之一,它采用统计或机器学习方法来建立和验证计算分子特征与分子实验测得生物活性之间的相关性。 这种方法在癌症药物发现中得到了广泛应用,使用的方法从简单的线性模型到非线性机器学习方法,如神经网络(NN)、支持向量机(SVM)或随机森林(RF)。 Para_07 这项合作研究的发现具有几个关键意义。 首先,它们突显了机器学习模型在预测药物协同作用方面的有效性。
论文全面总结了人工智能方法在药物发现中的应用,并针对Covid-19的药物发现过程进行了详细的分析。 1 摘要 人工智能的发展模仿了人脑的工作原理来理解现代问题。 总之,这些结果表明了在药物发现过程中采用深度学习策略的潜在好处。 2 介绍 20世纪末,化学信息学被引入药物研发过程。湿实验方法开发药物成功率低、耗时长、花费高,药物研发过程转向了新的范式。 图1 深度学习在药物发现和生物标志物开发中的潜力。每个药物发现时期的深度学习算法应用,包括临床评估、生物过程结合、化学修饰和开发、化合物的新合成。 图3 深度学习算法在药物发现中的应用,包括从头药物设计、理化性质预测、药物亲和力预测、QSAR、ADME性质预测、毒性分析,以及最新应用于SARS-CoV-2的药物发现。 7 物理化学性质 药物动力学参数的准确评估和预测对药物发现和开发过程有积极作用。深度学习模型在预测化合物的物理化学参数有着诸多应用。
作者/编辑 | 王建民 导读 药物发现工作中可用于训练计算模型的数据集通常很少。标记数据的稀疏可用性是人工智能辅助药物发现的主要障碍。解决该问题的一种方法是开发可以处理相对异构和稀缺数据的算法。 深度迁移学习是药物发现领域最常用的迁移学习模型。本文概述了迄今为止转移学习和药物发现的相关应用。此外,它为药物发现转移学习的未来发展提供了前景。 ? 然而,在药物发现过程的每个阶段,标记数据的规模都很小,通常从十到几万不等。因此,药物发现研究产生的数据量通常不会很 "大",因为标签数据的产生需要耗时且昂贵的实验。 4 药物发现中的迁移学习 迁移学习最早是在20世纪90年代提出的,但首次应用于药物发现是在2010年。直到过去几年深度迁移学习方法被提出并应用于药物发现,才引起人们的重视。 预测分子活性或性质 药物发现中最常见的任务之一是预测分子的活性或特性,包括生理特性、生物物理特性、物理化学特性和量子力学(QM)特性。这些性质的预测在药物发现中起着重要作用。
生命科学 Life scienc 药物发现和开发是一个复杂的多阶段过程,涉及靶点识别和验证、先导化合物发现、作用机理阐明、疗效和毒性评估,以及随后的临床试验和监管审批。 本期特刊重点介绍了这些新进展、新问题以及有望推动药物发现向前发展的创新战略。 这些论文解决了关键挑战、为加快新型疗法的发现和开发提供了令人兴奋的机遇,展示了药物发现领域的重大进展,预示着药物发现进入了一个新时代。感谢参与本特刊的所有作者和审稿人。 但FR和FRB能否以及如何加速药物发现,尚不明确。 但膜蛋白的疏水性和低丰度使其难以大规模表达和纯化,给药物发现带来了挑战。
人工智能可以为药物开发中复杂而漫长的发现过程提供更高的精度,从而缩短研发时间以及降低成本。 TorchDrug由MilaGraph发起,旨在推进人工智能在药物发现方向的开源共享,加速整个药物研发的进展。 中药物发现模型的快速原型设计。 2 平台展望 唐教授表示,虽然用于药物发现的人工智能继续不负众望,但药物发现的未来依赖于培育一个丰富的开源社区,并说道:“我们希望这个平台能够将机器学习和生物医学界的研究人员聚集在一起,加速药物发现的过程 ,并成为未来机器学习药物发现的领先的开源平台。”
药物发现是制药行业中最为关键且耗时的阶段之一,传统方法常依赖于实验室试验,耗费大量时间和资源。而随着计算能力的提升与人工智能的普及,基于Python的智能药物发现平台逐渐成为研究热点。 本文将带你了解如何使用Python构建一个简单的药物发现平台,从分子数据处理到药物活性预测,全面解析实现过程。 药物发现的关键步骤 分子数据准备:获取药物分子结构和生物活性数据。 筛选潜在候选药物:根据预测结果筛选出高潜力分子。 总结 本文详细介绍了如何使用Python构建智能药物发现平台,从分子特征提取到活性预测,展示了完整实现过程。通过机器学习与化学信息学的结合,药物发现效率可显著提高。 未来,随着技术的发展,智能药物发现将成为制药行业的重要支柱,为人类健康带来更多福音。
对于制药行业而言,机器学习方法的使用将彻底改变传统的药物发现过程。 图示:使用机器学习进行药物发现的各个领域。 (来源:论文) 人工智能已应用于药物设计的各种方面,如药物-蛋白质相互作用预测、药物疗效的发现、确保安全性生物标志物。 药物设计应用 药物设计技术依赖于基于不同 ML 算法开发的数据库。 (来源:论文) Hit发现 药物再利用的特点是「为目前处于存在阶段的药物」寻找新的适应症,它减少了药物发现的时间和危险情况。 虚拟筛选是在药物发现过程中使用的一种 AI 策略,用于定位小分子以区分药物靶标的结合结构。 用于药物发现电子资源中的 ML 图示:药物发现平台电子资源中的机器学习。(来源:论文) 泛检测干扰筛查中的 ML (PAINS) 可以根据要求从 PAINS 数据库访问泛检测信息。
数字孪生在药物的研发与制造环节也有巨大潜力,GSK将数字孪生用于优化疫苗相关实验、加速疫苗制造(参见GSK|用于加速疫苗开发和制造的数字孪生)。 而在药物发现过程中,DeepLife也做出了尝试。 DeepLife基于机器学习的数据管理方法和从自己平台、其客户和公共来源获取的数据,建立了一个协作的、数据驱动的药物发现生态系统。 将单细胞分析从体外转移到计算机中对药物发现具有深远的影响。 这些研究是验证数字孪生在药物发现中的使用的第一步,为更广泛地采用这种开创性方法奠定了基础。 药物重定向是数字孪生技术的主要应用。 DeepLife的概念验证研究验证了其数字孪生工作,巩固了其作为新兴领域主要参与者的地位,并为药物发现的新方法打开了大门。
AstraZeneca与BenevolentAI进行长期合作,利用人工智能和机器学习发现和开发慢性肾病(CKD)和特发性肺纤维化(IPF)的新疗法。 两个公司将共同解释这些结果,以了解这些复杂疾病的潜在机制,并更快地确定新的潜在药物目标。 药物发现和开发的未来在于缩小人工智能、数据和生物学之间的差距。我们很高兴能与AstraZeneca联手,为慢性肾脏疾病和特发性肺纤维化的治疗提供新的见解和新的治疗方法。” BenevolentAI是专注于药物发现的全球人工智能领导者。该公司开发了BenevolentAI平台,这是一个人工智能发现平台,科学家可以利用它来尝试发现疾病病理生理学中重要的新途径和机制。 ?
发现在通用蛋白质序列数据集上对模型进行预训练可以更好的支持特征细化和学习抗体结合预测。证明语言模型能够在抗体结合预测方面学习到比传统抗体序列特征或CNN模型学习的特征都更有效的特征。 总结 作者发现预训练中使用最多样化和通用的数据集 (Pfam) 时,亲和力性能最好。该结果支持抗体结构和功能特性不仅仅由抗体序列决定的假设。很可能还依赖于在一般蛋白质序列中更广泛遇到的其他特征。 其次,作者发现大小在 3200 到 6400 个样本之间的训练集在亲和力绑定任务中提供了最高的性能增益。 参考资料 https://arxiv.org/abs/2210.02881
近年来,深度学习在医药研究中的第一波应用出现了,它的用途超出了生物活性预测的范围,并且在解决药物发现中的各种问题方面显示出了前景。 一、介绍 各种形状和大小的数字数据呈指数级增长。 如何有效地挖掘大规模的化学数据成为药物发现的关键问题。更大的数据量与更多的自动化技术相结合促进了机器学习的进一步应用。 九、未来药物发现深度学习的发展 机器学习方法和DL通常需要大数据集来训练;然而,人脑只有几个例子才有学习的能力。如何只用少量的可用数据进行学习是机器学习中最热门的话题之一。 像一次性学习这样的方法与药物发现有关,药物化学家通常在可用数据有限的情况下开展新靶点研究。 然而,这些更先进的架构迄今尚未应用于药物研发。 结语 机器学习自20世纪90年代后期以来一直用于药物研发,并已成为药物发现的有用工具。
机器人、自动化和AI技术正在改变药物发现的方式。一些远程自动化智能化实验室逐渐兴起。 本文介绍了机器人自动化公司Arctoris的理念和特点。 越来越多的公司和研究人员试图利用人工智能来完成药物发现的不同任务 (靶点验证、合成、新药设计等)。而AI药物发现目前最重要的瓶颈是缺乏对高质量、结构良好的数据集的访问。 外部合作和内部管线 Arctoris与多家AI药物发现公司和机构建立了合作。 2020年9月,Arctoris与韩国上市公司Syntekabio合作开展药物发现工作。 2022年3月,Arctoris和AI药物发现公司Cyclica宣布双方同意扩大合作关系,将Cyclica的平台和能力与Arctoris的生物检测开发相结合,推进以阿尔茨海默病为重点的新型神经退行性药物发现项目 未来,自动化、机器人和AI技术的整合将进一步加速药物发现。
2022年5月25日,全球领先的数据和数字洞察组织Excelra宣布与发现和开发小分子变构药物的生物技术公司HotSpot Therapeutics建立合作伙伴关系。 合作旨在将GOSTAR的高质量注释数据集整合到HotSpot的机器学习和人工智能模型中来加强HotSpot的药物发现和开发工作。 随着GOSTAR数据的整合,HotSpot将继续推进小分子治疗候选药物的发现和开发,这些候选药物针对的是传统小分子方法无药可及和难药可及的变构靶点。 HotSpot Therapeutics联合创始人兼首席科学官Geraldine Harriman称,HotSpot的Smart AllosteryTM药物发现平台已经提供了一系列小分子抑制剂候选药物, 这些口袋在很大程度上未被工业开发,在药物发现方面具有巨大的潜力,并为展示新药理学的高效和选择性小分子提供了系统设计。
计算机辅助药物研发(computer-aided drug discovery,CADD)的概念在 20 世纪 70 年代提出并且逐步发现。 总体上,计算辅助方法已经成为药物发现过程中一个不可或缺但相对平稳的部分。然而,在过去的几年里,一些科学和技术突破导致了计算方法重新登上了浪头。制药和生物技术公司正在扩大其计算药物的能力。 化学空间的拓展 Bigger is better 长期以来,筛选库的大小和多样性一直是整个药物发现过程的瓶颈。 数据驱动的方法和 DL 在基于 AI 的人脸识别、ChatGPT 和 AlphaFold 等技术的时代,数据驱动的深度学习方法在药物发现的各个阶段也存在着巨大的场景。 数据驱动方法在药物发现中有着悠久的历史,其中机器学习算法,如支持向量机、随机森林和神经网络,尽管效果参差不齐,但已被广泛用于预测配体性质和靶点活性。 药物发现的关键愿景是开发出通用性的 AI 模型。
编译 | WJM 计算化学和基于结构的设计历来被认为是可以帮助加速药物发现过程的工具,但通常不被认为是小分子药物发现的驱动力。 介绍 过去十年见证了计算建模能力的巨大进步,它推动了小分子候选药物的更快和更成功的发现。 当然,这些成功提出了一个重要的问题:先进的计算药物设计方法是如何具体应用的,药物发现的哪些阶段和药物发现项目的哪些类型最有可能从这些技术中受益? 苗头化合物发现 为一个蛋白质靶点启动药物发现工作需要确定具有可测量亲和力的化学物质。基于配体和基于结构的虚拟筛选方法通常被用来识别这种配体。 当考虑基于结构的药物设计项目的靶标时,第一步是评估是否有足够的三维结构。过去的十年中,用于基于结构的药物发现的蛋白质结构的数量有了很大的提高。
该研究通过对这数千种已经开发的药物化合物的系统分析,发现了近50种药物存在以前无法识别出来的抗癌活性。揭示了新的药物机制和靶标,为加速开发新的癌症药物或重新利用现有药物治疗癌症提供了可能的方向。 ? 原则上,当发现现有药物的新靶点时,这些药物也可以作为药物开发的起点。迄今为止,大多数针对肿瘤药物再利用的发现都是偶然的,系统的大规模筛查整个药典仍不可行。 当可预测性与双峰性评分作图时,观察到同样的高度可预测的非肿瘤性药物杀伤现象(图3)。 ? 图3使用PRISM再利用数据集发现预测性生物标志物 作者还在论文中具体描述其中的四种化合物。 作者注意到,使用基于细胞的筛查(例如PRISM)可以发现以前未知的作用机制,而使用传统的生化筛查测定法则很难发现。 从历史上看,基于细胞的表型筛选的一个挑战是难以获得分子对分子的作用机理的了解。 这项研究中描述的PRISM再利用数据集几乎代表了人类测试过的所有药物的一半。鉴于从最初的筛选中会出现大量出乎意料的发现,作者认为在药物和癌症模型方面都应扩大PRISM资源。
空间转录组学的出现让研究人员能够在天然结构下观察生物标志物、空间相互作用和肿瘤转录组,帮助他们更好地鉴定潜在的药物靶点和耐药机制。 研究人员已利用我们的Visium空间基因表达技术开发出适用于肿瘤学药物发现的可再现工作流程,并通过治疗后患者肿瘤样本的研究确定了耐药和复发的机制。 了解相邻细胞之间的潜在的互作关系,能帮助研究者了解肿瘤微环境(TME)在肿瘤的发生发展和药物治疗过程中发挥的作用。 分析发现发现B细胞与PAX5激活区域共定位,这说明B细胞可能是新辅助治疗激活免疫细胞中的重要组成部分。 我们很高兴看到空间转录组学如何继续帮助研究人员分析患者样本,鉴定新的生物标志物和药物靶点,并向真正的个性化医疗迈进。