文章信息
题目(英文原题):
A machine learning based framework to tailor properties of nanofiltration and reverse osmosis membranes for targeted removal of organic micropollutants
作者:
Airan Hu, Yanling Liu*, Xiaomao Wang, Shengji Xia, Bart Van der Bruggen
单位(中文全称):
同济大学 污染控制与资源化研究国家重点实验室
同济大学 先进膜技术中心
教育部长江水环境重点实验室
同济大学 上海污染控制与生态安全研究院
清华大学 环境模拟与污染控制国家重点联合实验室
比利时鲁汶大学 化学工程系
期刊:
Water Research(水研究),2025年,第268卷,122677
DOI:
https://doi.org/10.1016/j.watres.2024.122677
一句话概括核心结论或创新亮点
本研究构建了一个可解释、具备良好泛化能力的机器学习框架,能够定量识别有机微污染物去除的主控机理,并为纳滤/反渗透膜的定向选择与设计提供精准参数指导。
研究背景与科学问题
有机微污染物(Organic Micropollutants, OMPs)广泛存在于水环境中,具有低浓度、高毒性、难降解等特点,对生态系统和人体健康构成潜在风险。
在现有水处理技术中,纳滤(NF)与反渗透(RO)膜因其高效、稳定、绿色等优势,被广泛用于OMPs去除。
然而,该领域仍面临三大核心挑战:
OMPs种类极其多样
,分子尺寸、电荷和疏水性差异显著,实验评价成本高、周期长;
现有研究多为“单膜–单污染物”测试结果,难以整合为可指导工程实践的系统规律;
虽已有机器学习用于预测截留率,但模型泛化能力不足、缺乏机理解释性,难以反向指导膜材料设计。
本研究聚焦的科学问题是:
能否构建一个兼具预测能力与机理可解释性的机器学习模型,用于定量指导针对特定OMPs的膜性能定制化设计?
技术原理与创新点
核心技术原理
构建包含793组实验数据(101种膜、209种OMPs)的文献数据库;
采用Extreme Gradient Boosting(XGBoost)回归模型建立OMPs截留率预测模型;
结合领域知识进行特征工程,引入反映核心机理的组合特征:
尺寸比
:OMPs范德华半径 / 膜平均孔径(表征尺寸筛分效应)
电荷乘积
:膜Zeta电位 × OMPs电荷(表征静电作用)
关键创新点
机理驱动的特征构建,避免“黑箱式”建模
引入数据泄露管理与多次随机划分评估,确保模型稳健性
结合SHAP、PDP、ICE等方法,实现模型的全局与局部可解释性
从“预测性能”进一步迈向“反向设计指导膜参数”
实验验证与性能
模型构建与对比
对比三类模型:
XGBoost在预测精度与泛化能力方面显著优于传统模型。
外部数据集验证
使用19种高风险OMPs(未参与训练)作为外部测试集;
预测性能仍保持R²_adj = 0.74;
RMSE = 11.85,MAE = 8.33,显示出优秀的泛化能力。
学术贡献
提出
一个面向OMPs风险控制的通用型机器学习框架
定量识别
纳滤/反渗透膜去除OMPs的主控机理:
尺寸筛分效应(主导)
静电相互作用(次主导)
实现
从OMPs分子性质出发,反向推导膜孔径与表面电性参数
推动
机器学习从“性能预测”向“材料定向设计”范式转变
局限性与未来方向
当前局限性:
数据主要来源于文献,测试条件仍偏理想化;
尚未充分考虑:
pH变化
共存无机盐
天然有机物等复杂水基质效应
未来研究方向:
构建标准化、高一致性实验数据库
纳入更多水质与操作参数作为输入特征
扩展模型至真实水厂运行条件下的膜性能预测
与膜材料合成实验形成**“模型–实验”闭环优化**
总结
本研究证明了机器学习不仅可以预测膜对有机微污染物的去除性能,更能反向指导膜材料的定制化设计。
通过引入机理约束与模型可解释性,该工作为高效膜开发、风险导向水处理设计提供了一条可复制的新路径,对膜科学研究者和工程实践者均具有重要启示意义。
图文赏析
图1机器学习整体流程示意图,包括数据集构建、模型训练与模型应用三个阶段。
图2特征工程前后输入特征的Pearson相关系数矩阵。
图3训练集与典型OMPs测试集在各特征维度上的数据分布对比。
图4各输入特征的SHAP值分布及平均绝对贡献,反映其对OMPs截留率预测的重要性。
图5
(a) 各特征的ICE曲线(灰线)与一维PDP(红虚线);
(b) 不同特征组合的二维PDP,展示尺寸筛分与静电作用的耦合效应。
图6不同膜MWCO与Zeta电位条件下,高风险OMPs的综合截留率变化趋势。
图7在不同膜参数组合下,各典型OMPs的预测截留率及其变化范围。