首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Commun. | 引入不确定性建模的机器学习: 预测全球化学品的非致癌人体毒性

Nat. Commun. | 引入不确定性建模的机器学习: 预测全球化学品的非致癌人体毒性

作者头像
MindDance
发布2026-01-22 12:37:09
发布2026-01-22 12:37:09
1390
举报

DRUGONE

人类每天通过空气、水、食物和消费品接触大量化学物质,但绝大多数化学品缺乏系统的人体毒性数据,严重制约了健康风险管理。尽管机器学习模型在毒性预测方面表现出较高准确性,但其预测不确定性通常未被量化,削弱了结果在监管与决策中的可信度。

研究人员开发了不确定性感知的机器学习模型,用于预测化学品的生殖/发育毒性和一般非致癌性人体毒性效应剂量。该模型能够同时量化数据不确定性与模型不确定性,并给出与真实预测误差和化学结构熟悉度一致的置信区间。研究人员对超过 10 万种全球上市化学品 给出了带 95% 置信区间的毒性预测,并识别出高毒性与高不确定性“热点”化学类别。结果表明,对预测不确定性的透明刻画是提升毒性预测可信度、推动机器学习结果进入化学品评估实践的关键。

全球已有超过十万种化学品被广泛用于工业和消费产品,但其中绝大多数缺乏系统的非致癌人体毒性评估数据。毒理学评估中常用的关键指标是“效应起始点”,即不良健康效应开始显现的最低剂量。然而,基于动物实验的效应起始点数据只覆盖了极少数化学品。

机器学习方法被视为弥补这一数据缺口的重要工具,但传统模型通常只提供单一预测值,无法反映模型在不同化学结构和数据稀缺区域的可靠性差异。尤其在模型外推到结构陌生或训练样本稀少的化学品时,预测结果的可信度难以评估。因此,在毒性预测中引入系统、可校准的不确定性量化机制,是推动机器学习结果用于化学品风险评估和监管决策的关键前提。

方法

研究人员基于已整理的人体非致癌毒性效应起始点数据,构建了覆盖生殖/发育毒性与一般非致癌毒性的训练集,并采用多种分子描述符表征化学结构。在模型层面,研究人员比较了两类不确定性感知方法:基于保序预测的频率学模型和基于概率建模的贝叶斯神经网络。模型通过交叉验证评估预测性能,并从置信度一致性、误差一致性和结构距离一致性三个角度系统校准预测不确定性。最终,选择性能与校准性最优的模型,对大规模上市化学品进行毒性与不确定性联合预测。

图1|不确定性感知毒性预测的整体方法流程。

结果

不确定性感知模型的预测性能与校准性

研究人员发现,引入不确定性建模后,模型在预测精度上仅有轻微下降,但能够提供与实际预测误差高度一致的置信区间。预测误差较小的化学品通常伴随较低的不确定性,而结构陌生的化学品则显示出更高不确定性。

图2|不确定性感知模型的预测性能与不确定性校准结果。

面向结构多样化化学品的稳健预测

当模型应用于包含无机物、金属和有机金属化合物等“非标准化”化学品时,预测误差显著上升,但模型同时给出了明显扩大的不确定性区间,反映出其对外推风险的自我识别能力。

图3|标准化与非标准化化学品的预测性能与不确定性对比。

超过 10 万种上市化学品的毒性预测

在对全球上市化学品进行整体预测后,研究人员发现大多数化学品呈现中等毒性水平,但不同化学类别之间存在显著差异。不确定性分布显示,模型在大多数情况下仍处于可校准范围内。

图4|全球上市化学品的毒性与不确定性空间分布图。

高毒性与高不确定性化学类别识别

研究人员识别出多类具有潜在高风险的化学品簇,包括有机硫磷化合物、含氟化合物以及多卤代芳香族化合物等。这些类别不仅预测毒性较高,同时伴随显著的不确定性,提示其在风险评估和数据补充中的优先级。

图5|按化学类别汇总的毒性与不确定性排序结果。

讨论

本研究展示了不确定性感知机器学习在大规模化学品毒性评估中的应用潜力。通过同时给出预测值和置信区间,模型避免了“无数据即无风险”的隐性假设,为监管和风险评估提供了更稳健的信息基础。

研究人员认为,该框架的核心意义在于:一是提升机器学习毒性预测的透明度和可信度;二是为化学品分级管理和优先监管提供依据;三是为后续实验数据生成和模型改进指明方向。未来,将该不确定性建模思路拓展到其他毒性终点、暴露参数和环境效应指标,有望进一步推动机器学习在化学品安全与可持续评估中的系统应用。

整理 | DrugOne团队

参考资料

von Borries, K., Beckwith, K.V., Goodman, J.M. et al. Uncertainty-aware machine learning to predict non-cancer human toxicity for the global chemicals market. Nat Commun 17, 647 (2026).

https://doi.org/10.1038/s41467-025-67374-4

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档