IT时代网6月26日消息,上海科学院下属上海计算机软件技术开发中心人工智能团队提出一项名为OSNIP的创新框架,通过轻量部署方式实现了高安全性、近无损效用与低延迟的兼顾,为敏感数据安全上云提供了可落地的技术方案。该成果已被国际顶级会议ICML 2026收录。
长期以来,"隐私-效用-效率"构成了大模型推理服务难以突破的"不可能三角"。企业在使用云端大模型时,若提示词包含商业策略或未公开代码,隐私安全难以保障。上海软件中心人工智能部副部长马泽宇指出,越大的客户越不敢用真正强大的模型——他们不缺预算,而是担心商业机密被服务商留存或用于训练。
传统路线各有短板:同态加密计算量极大,延迟从毫秒级飙升至小时级;差分隐私则通过注入噪声破坏语义,拉低回答质量。团队未沿用传统思路,而是利用大模型内部高维连续表征空间的特性,基于流形假设从理论上证明了"混淆语义零空间"的存在——落入这一空间的表征对攻击者是乱码,对大模型却与原文等价。
基于此发现,团队设计了OSNIP框架,仅需在客户端部署轻量加密器即可实时加密。实测显示,在Llama、Qwen等主流开源模型上,面对KNN逆向攻击,OSNIP将攻击成功率降至0.00%,模型回答质量保留率近乎100%,额外延迟仅0.96毫秒。团队下一步将向更大参数规模及多模态场景拓展,并推动云端模型开放表征向量API接口,加速工程化落地。
创作声明:本文借助AI辅助创作