借助先进生成模型,人工智能人脸合成技术(深度伪造)发展迅猛,能够生成高度逼真的篡改影像,这类伪造内容与真实素材的区分难度持续攀升。滥用该类技术会损害公众信任、破坏民主秩序,在敏感场景下危害尤为突出。除检测精度外,负责任的取证分析还要求技术落地秉持公平与伦理准则。然而现有研究表明,各类检测算法在不同人群上的识别效果存在显著差异,现有技术尚未妥善解决该问题;同时各类公平性优化方案,在数据分布发生偏移时往往难以维持稳定效果。为攻克这一难题,美国普渡大学胡暑助理教授领衔在2025年NeurIPS主办了首届聚焦人工智能人脸检测公平性的竞赛,将公平性相关研究与现实中的深度伪造鉴别难题相结合。
图片来自Springer
全文下载:
The Competition of Fairness in AI-generated Face Detection: Methods and Results
Shu Hu, Li Lin...Ting-Wan Kao
https://link.springer.com/article/10.1007/s11633-026-1637-x
全文导读
图1 深度伪造检测中的公平性难题,红色方框标注出模型的错误预测结果。
讨论与结论
通过筹办本次AI人脸伪造检测公平性竞赛,我们从赛事结果中收获诸多重要结论,具体如下:
1)本次竞赛获得了全球范围内的广泛关注,共有来自20个国家的64支队伍完成注册。即便报名截止日期过后,我们仍持续收到报名申请。为保证赛事公平性,我们并未接纳逾期报名的队伍参与本次竞赛,不过这也促使我们计划在近期举办第二届AI-Face专项竞赛。
2)通过分析顶尖参赛队伍的实验结果,我们意识到需要重新思考如何避免参赛队伍为追求优异的公平性指标,却牺牲模型实际可用性能。一种可行思路是设计加权评测指标,同步兼顾模型可用性与公平性表现;另一种方案是采用帕累托前沿分析,直观量化可用性与公平性二者间的取舍关系。在该评测框架下,每支队伍可基于不同训练阶段,在测试集上提交多组(可用性、公平性)性能数据,以此绘制二者的权衡曲线。依托这些曲线,我们能够搭建一套排名规则,筛选出在可用性与公平性之间实现均衡且稳定表现的参赛方案。举例来说,可在统一模型可用性水平下对比各队伍,将其平均公平性表现作为排名依据。
3)绝大多数参赛队伍的AUC指标均优于赛事提供的基准模型,这说明我们选用的基准模型结构过于简易。基于此,我们计划引入性能更先进的基准模型,以此提升下一届竞赛的挑战难度。
4)先系统性梳理训练数据集的优势与短板,再开展精细化数据筛选处理,是多数队伍采用的通用方案。其中,蚂蚁集团、AIST-ICT、CAU-KETI三支队伍通过分析不同来源伪造样本的数据分布,以此指导自身的数据预处理与模型训练流程。值得一提的是,Entrust队伍对测试集展开深度分析,推断出样本类别标签与人群分组标签,该分析结果极大优化了其最终模型设计。
5)多支队伍并未采用单一模型,而是选用混合专家模型架构(蚂蚁集团、AI-Hunter、ICI Innolabs、kunkun 队伍)并搭配数据增广策略(蚂蚁集团、Entrust、AIST-ICT、ICI Innolabs 队伍)。实验结果证明,这类组合方案效果显著,能够有效提升模型综合性能。
6)多支队伍借助基础大模型提取精度更高、泛化迁移能力更强的特征表征,显著提升了模型整体性能。例如,Entrust队伍与CAU-KETI队伍采用最新的CLIP模型,AI-Hunter队伍则选用DINOv3模型。
7)多支队伍在模型训练阶段,使用外部数据集对赛事提供的数据集进行扩充。例如蚂蚁集团引入了公开的真实人脸数据集与深度伪造数据集,ICI Innolabs队伍额外采用了来自Kaggle 平台的深度伪造数据集。该策略能够有效提升训练后模型的泛化能力。
总体而言,本次竞赛涌现出多种多样的创新方案,从数据预处理策略到全新模型架构设计,各类方法均以提升AI人脸伪造检测的公平性为目标,成果令人振奋。与此同时,赛事也暴露出若干亟待深入研究的关键难题,具体如下:
1)如何避免参赛队伍推导测试集标签,这一问题仍有待深入研究。Entrust队伍提到,本次测试集的真实标签可通过图像文件名轻易识别,在后续赛事设计中需要修复该漏洞。
2)尽管各参赛队伍相比基准模型均实现了公平性指标提升,但AI人脸伪造检测的公平性问题尚未得到彻底解决,如何在模型实用性能与公平性之间实现有效平衡仍是一大开放性难题。
3)可进一步优化竞赛任务设定与评价指标,遏制那些以牺牲实用性能为代价换取公平性提升的浅层简易方案,引导研究者提出更贴合实际落地场景的算法。
4)竞赛期间我们与各顶尖队伍交流了他们的参赛方案,部分队伍提到借助后处理技术进一步优化公平性。这也促使我们深入探讨:是否允许使用此类后处理手段、以及如何规范使用规则,从而保障公平、有意义的横向对比。
5)为催生更多前沿创新方案,未来竞赛可进一步提升难度,例如不再局限于人脸图像,拓展至更广的视觉场景,同时明确考核模型在人脸与其他类别图像上的性能取舍关系。
以上方向均留作后续研究工作。我们将持续优化赛事设计、扩大赛事影响力,最终推动面向 AI 伪造媒体治理的公平、合规人工智能技术发展。本文所得结论具备实质性参考价值,可为本领域及其他方向的赛事主办方提供借鉴。
全文下载:
The Competition of Fairness in AI-generated Face Detection: Methods and Results
Shu Hu, Li Lin, Shail Desai, Aditya Pawar, Guangyu Lin, Xin Wang, Daniel S. Schiff, Sachi Nandan Mohanty, Ryan Ofman, Narcis Bejtic, Jon Gillham, Wenbin Zhang, Baoyuan Wu, Cristian Canton, Xiaoming Liu, Luisa Verdoliva, Siwei Lyu, Yongwei Tang, Zhiqiang Wu, Jiawen Seow, Zara Alaverdyan, Anne-Flore Baron, Simon Bozonnet, Martins Bruveris, Jochem Gietema, Lucia Innocenti, Lisa Ivanova, Olivier Koch, Harry Ni, Arthur Pajot, Romain Sabathe, Fengming Gu, Xingming Long, Jie Zhang, Wenqing Ge, Xiangkui Cao, Yuecong Min, Yingjie Liu, Zonghui Guo, Shiguang Shan, Jinhee Park, Minjun Kim, Ahyeon Park, Guisik Kim, Taewoo Kim, YoungJoon Yoo, Junseok Kwon, Zhaoda Li, Mengyun Tang, Leyang Huang, Bogdan Dura, Sebastian Balmuş, Fang-Yi Su, Tsung-Hua Lee & Ting-Wan Kao
https://link.springer.com/article/10.1007/s11633-026-1637-x
BibTex:
@Article {MIR-2026-01-033,
author={Shu Hu, Li Lin, Shail Desai, Aditya Pawar, Guangyu Lin, Xin Wang, Daniel S. Schiff, Sachi Nandan Mohanty, Ryan Ofman, Narcis Bejtic, Jon Gillham, Wenbin Zhang, Baoyuan Wu, Cristian Canton, Xiaoming Liu, Luisa Verdoliva, Siwei Lyu, Yongwei Tang, Zhiqiang Wu, Jiawen Seow, Zara Alaverdyan, Anne-Flore Baron, Simon Bozonnet, Martins Bruveris, Jochem Gietema, Lucia Innocenti, Lisa Ivanova, Olivier Koch, Harry Ni, Arthur Pajot, Romain Sabathe, Fengming Gu, Xingming Long, Jie Zhang, Wenqing Ge, Xiangkui Cao, Yuecong Min, Yingjie Liu, Zonghui Guo, Shiguang Shan, Jinhee Park, Minjun Kim, Ahyeon Park, Guisik Kim, Taewoo Kim, YoungJoon Yoo, Junseok Kwon, Zhaoda Li, Mengyun Tang, Leyang Huang, Bogdan Dura, Sebastian Balmuş, Fang-Yi Su, Tsung-Hua Lee, Ting-Wan Kao},
journal={Machine Intelligence Research},
title={The Competition of Fairness in AI-generated Face Detection: Methods and Results},
year={2026},
volume={23},
issue={3},
pages={501-527},
doi={10.1007/s11633-026-1637-x}}
特别感谢本文第一作者、普渡大学胡暑老师对以上内容的审阅和修改!