对于个人电子产品而言,例如手机,平板电脑,便携式电脑等等,或多或少,都会涉及到隐私计算,那么什么是隐私计算呢?理解隐私计算,先要澄清“隐私”的概念,那么,什么是隐私呢? 进而,明确隐私计算分别与隐私和计算之间的关系,即隐私计算是为了实现个人隐私保护而进行的计算还是在实现了隐私保护的前提下进行的计算?最后,才是隐私计算涉及的技术和方法。 1. 什么是隐私? 隐私计算 一般地, 对隐私计算有不同的理解。一种是隐私计算是隐私保护的一部分,为了实现隐私保护而采用的技术。另一种是对隐私保护的数据进行计算,侧重在隐私数据应用的层面。 5.1 隐私计算的发展 隐私计算的发展历程如下图所示: 5.2 隐私计算的概念界定 2016年,中国科学院信息工程研究所研究员李凤华等对隐私计算在概念上进行了界定: 隐私计算是面向隐私信息全生命周期保护的计算理论和方法 5.3 隐私计算的技术参考架构 在2021年, 在腾讯隐私计算白皮书中给出了隐私计算的技术架构参考: 5.4 隐私计算的技术路径 隐私计算技术和方案的种类较多,为了便于理解和分类,业界通常将上述技术分为三大路径
什么是隐私计算 从20世纪70年代一直到近年,隐私计算交叉融合了密码学、人工智能、计算机硬件等众多学科,逐渐形成以多方安全计算、联邦学习、可信执行环境为代表,混淆电路、秘密分享、不经意传输等作为底层密码学技术 隐私计算分类 从技术角度出发,隐私计算是涵盖众多学科的交叉融合技术,目前主流的隐私计算技术主要分为三大方向:第一类是以多方安全计算为代表的基于密码学的隐私计算技术;第二类是以联邦学习为代表的人工智能与隐私保护技术融合衍生的技术 ;第三类是以可信执行环境为代表的基于可信硬件的隐私计算技术。 图1 多方安全计算技术框架 如图1所示,从底层硬件来说,多方安全计算以通用硬件作为底层架构设计基于密码学的算法协议来实现隐私计算。 从算法构造来说,常应用同态加密、差分隐私技术以及包括基于秘密分享、不经意传输、混淆电路等密码学原理的各类多方安全计算协议和其它用于保证隐私计算的密码学技术来提升安全性。
例如,密集计算可能只在设备空闲、网络空闲上时执行。 这些工作流程为构建可伸缩的基础设施和 API 是一个重大挑战。 3. 联邦计算中的隐私保护 联邦学习提供了各种开箱即用的隐私优势。 虽然任意函数的多方安全计算在大多数情况下仍然是计算上的障碍,但是已经开发了联邦环境中向量求和的专门聚合算法,即使对观察服务器并控制大部分客户端的对手也可以保护隐私,同时保持对客户端退出计算的鲁棒性: 通信效率 在分布式差分隐私下,客户端首先计算特定于应用程序的最小数据,用随机噪声轻微干扰这些数据,并执行隐私聚合协议。然后,服务器只能访问隐私聚合协议的输出。 因为差分隐私假设了一个“最坏情况的对手”,具有无限的计算和访问任意侧的信息。这些假设在实践中往往是不切实际的。因此,使用限制每个用户影响的差分隐私算法进行训练具有实质性的优势。 这些审计技术甚至在使用大 ε 时也很有用,它们可以量化差分隐私最坏情况下的对手与计算能力和侧面信息有限的现实对手之间的差距。
本文的内容为基于 《隐私计算FATE-概念与单机部署指南》中部署的环境。
隐私数据计算当今最具创新性的数据驱动产品和解决方案往往需要处理隐私数据。如何在使用敏感数据的同时保护数据主体、所有者或用户的隐私信息不被泄露,成为一个关键问题。 两种隐私保护技术安全多方计算(MPC)MPC允许多方在不公开各自私有数据的情况下,共同计算一个涉及所有数据的功能。 技术对比特性 MPC DP 隐私保证 仅泄露计算结果 相对轻量 技术局限MPC的挑战:通用协议通信复杂度高函数设计需谨慎避免边缘情况泄露可能被辅助信息反向推导DP的限制:必须添加噪声对异常值敏感的函数难以兼顾隐私与精度主要适用于数值型统计计算融合应用在某些场景下可结合两种技术优势 :使用MPC计算差分隐私近似函数,既能获得MPC的输入保护,又能享有DP的抗辅助信息攻击特性。
【引】走近任何一个领域,都会发现自己的渺小和微不足道,会越发地敬畏技术和未知,隐私计算也不例外。 id=3561800)可以对全同态加密有一个概貌,从而了解其脉络方向,进而对隐私计算增加一点点认知。 隐私计算中的完同态加密为加密数据提供量子安全级的计算,保证明文数据及其衍生计算结果永远不会公开,并且在基础设施受到破坏的情况下保持安全,不会被修改和/或破坏。 全同态加密的典型应用场景 随着全同态加密的硬件加速器出现,一些基于全同态加密的可能应用领域包括: 6.1 在整个生命周期内保护数据不被破坏/修改 加密数据上的隐私保护计算保证了数据及其派生计算结果在基础设施受到破坏的情况下不受修改和 与数据库、云计算、 PKI 和人工智能的影响相似,全同态加密将引发机密/隐私信息保护、处理和共享方式的巨大变化,并将从根本上改变基础计算的进程。
基于上文 《隐私计算FATE-模型训练》 中训练出来的模型进行预测任务 关于 Fate 的安装部署可参考文章 《隐私计算FATE-核心概念与单机部署指南》 二、查询模型信息 执行以下命令,进入 Fate
、隐私计算等产品研发。 隐私计算产业也在加速崛起。中国信息通信研究院报告指出,预计到 2025 年,中国的隐私计算市场规模将达到百亿元人民币。 隐私计算技术发展情况 隐私计算是隐私保护计算(Privacy-preserving Computation)的简称,它能够在保证数据提供方不泄露原始数据的前提下,对数据进行分析、处理和使用,是一个广义的概念 ,已发表近 10 篇隐私计算研究论文,提交了 60 多件隐私计算技术发明专利申请,有多个商用隐私计算和联邦学习的平台产品目前已经通过腾讯云对外开放。 百度智能云还与区块链平台融合,通过将区块链技术纳入云计算与隐私计算的过程,推动隐私计算在各种场景中落地。
解决医疗数据孤岛,是促进医学研究的关键,而隐私计算技术的出现在一定程度上解决了该难题。 通过利用隐私计算的技术,可以实现多个医学科研单位及医院数据的安全共享。 2022年9月21日,绿盟科技与海光公司联合对外发布了隐私计算新产品:“数安湖”隐私计算平台[21]。 “数安湖”隐私计算平台目前覆盖了联邦学习、安全多方计算和可信执行环境三种隐私计算的核心能力,具有数据可用不可见、核心数据“拿不走”、恶意行为“跑不掉”等产品特点。 然而从现实情况调研来看,目前隐私计算在医疗行业的实际应用可谓凤毛麟角,一方面是由于隐私计算属于一个新兴的技术,仅有极少数企业推出了基于隐私计算医疗行业成熟的解决方案;另一方面也是由于实际应用方并不清楚隐私计算能给他们带来的实际价值 ,从而减缓了隐私计算实际落地的进程。
随着移动互联网和云计算技术的迅猛发展,越来越多的数据在云环境下进行存储、共享和计算,云环境下的数据安全与隐私保护也逐渐成为学术界以及工业界关注的热点问题。 作为基于密码学的隐私保护技术的一种替代方案,可信执行环境(Trusted execution environment,TEE)基于硬件安全的 CPU 实现了基于内存隔离的安全计算,可在保证计算效率的前提下完成隐私保护的计算 TEE 与 REE 关系图示 TEE 强大的数据安全和隐私保护能力,使其成为隐私计算主要技术流派之一,比 REE 得到了更广泛的应用。 二、TEE 与其他隐私计算技术 TEE 与安全多方计算、同态加密对比 安全多方计算(MPC)、同态加密是和 TEE 一样各有所长的隐私计算技术。 因此通用型 MPC 协议很难在大规模计算环境下广泛应用,更多是针对特定问题的 MPC 协议,如隐私信息检索(PIR)、隐私集合求交(PSI)等,而同态加密技术则大多仅应用于某些计算协议中关键步骤的计算。
常见隐私计算技术包括了多方安全计算、联邦学习、可信执行环境、同态加密、差分隐私等,通过应用隐私计算技术,企业用户能在提供数据隐私保护的前提下,实现数据在流通共享中的“可用不可见”。 综合考虑企业关注度、行业落地进展等因素,爱分析在本次研究中选取了应用层的金融隐私计算解决方案、政府与公共服务隐私计算解决方案、医疗隐私计算解决方案,以及平台层的隐私计算平台,共4个特定市场,进行重点研究 政务部门对隐私计算解决方案的核心需求包括:能用隐私计算技术打通多方数据,且隐私计算的使用门槛要低。 隐私计算平台具备通用的隐私计算技术服务能力,能够支撑企业用户构建各类隐私计算应用解决方案。 因此,近年来各行业众多企业和机构都开始关注隐私计算,并希望搭建隐私计算平台,为进一步探索隐私计算的应用场景构建基础设施。企业对于隐私计算平台的核心需求通常包括:具备较高的通用性。
近日,港科大计算机科学与工程系副教授陈凯与杨强联合撰写的新书《隐私计算》已经出版,为读者深入解读保护数据安全的隐私计算技术。 数据要素已成为核心生产要素与推动经济发展的核心力量。 这本书是为计算机科学、隐私保护、大数据和人工智能相关专业的学生,以及对隐私计算感兴趣的从业者、从事隐私计算研究的研究人员、法律法规制定者和政府监管者编写的。 《隐私计算》系统讲解了隐私计算的基础技术和实践案例,并具有以下 5 大特色。 一是内容系统完整全面。 第三部分介绍基于隐私计算技术构建的隐私计算平台和实践案例,隐私计算平台主要包括面向联邦学习的 FATE 平台和加密数据库的 CryptDB 系统等五个平台,以及隐私计算平台的效率问题和常见的加速策略;实践案例部分主要介绍包括金融营销与风控 此外,《隐私计算》还展望了隐私计算未来的研究和落地方向。在附录中介绍了当前新的中国数据保护法律概况。
那么,区块链技术是否能够与隐私计算融合呢? 1. 回顾隐私计算 隐私计算技术可以归纳为三类: 数据加密与再处理、数据不动而模型动、 通过可信环境进行大数据分析与管理,即联邦机器学习、可信执行环境和多方安全计算三大核心技术。 基于区块链的隐私计算 区块链作为一种能够提供分布式信任机制的关键技术,其与隐私计算技术进行融合可以整合双方的优势,互通有无。 硬币是有两面的,将区块链应用在隐私计算中,但仍存在一些问题。在区块链与多方安全计算应用中,加解密的过程会损耗大量计算和通信资源。 小结 隐私计算为打破数据孤岛、发掘数据价值、加强数据安全等方面提供了解决办法,但也产生了新的隐私安全问题。区块链因具有去中心化、可溯源、不可篡改等特点,为隐私计算提供了新的解决思路。
导读:本文将从隐私计算技术的起源开始说起,介绍什么是隐私计算,以及隐私计算的发展脉络,并进一步介绍隐私计算技术的一些应用场景。 ▲图1-1 根据生命周期划分的隐私计算技术 根据数据生命周期,我们可以将隐私计算的参与方分为输入方、计算方和结果使用方三个角色,如图1-2所示。 在一般的隐私计算应用中,至少有两个参与方,部分参与方可以同时扮演两个或两个以上的角色。计算方进行隐私计算时需要注意“输入隐私”和“输出隐私”。 与之基本同义的一个概念是“隐私增强计算技术”,通常可换用。本文统一使用中文简称“隐私计算技术”。 03 隐私计算技术的发展脉络 现在,除了MPC技术外,隐私计算领域还呈现出更多新的技术特点和解决方案。 ▲图1-4 隐私计算体系架构 04 隐私计算技术的应用场景 隐私计算技术可以为各参与方提供安全的合作模式,在确保数据合规使用的情况下,实现数据共享和数据价值挖掘,有着广泛的应用前景。
点击“博文视点Broadview”,获取更多书讯 目前,隐私计算平台广泛用到了多种安全技术,包括同态加密、秘密共享、差分隐私、可信执行环境,以及其他一些安全多方计算技术。 接下来,我们对隐私计算的效率问题及相应的解决方法进行详细的介绍。 隐私计算技术中的效率问题 01. 同态加密 对数据进行同态加解密需要进行一些数学运算。 异构加速隐私计算 01. 异构计算定义 异构计算是指用不同类型的指令集和体系架构的计算单元组成系统的计算方式。 通过异构计算来解决隐私计算所面临的算力挑战已经成为当前学术界和工业界的一个热门研究方向。下面以联邦学习FATE 平台为例介绍如何通过异构计算加速隐私计算。 本文节选自陈凯和杨强教授新书《隐私计算》,想要了解更所关于隐私计算的内容,欢迎阅读本书! 下单立减50 快快扫码抢购吧!
而隐私计算通过同态加密、多方安全计算、可信执行环境等技术,可以保证数据在使用过程中可用不可见。 值得关注的是,隐私保护是多方面的。 隐私计算协议 隐私计算协议,主要从数据的产生、收集、保存、分析、利用、销毁等环节对隐私进行保护,除了常见的DeFi、NFT等场景外,还计划与大数据和AI行业进行深度结合。 目前主要的隐私技术包括零知识证明、安全多方计算、基于现代密码学的联邦学习、可信执行环节(TEE)等。 值得注意的是,隐私计算不是区块链的原生产物,就像分布式存储在区块链诞生之前就已经存在了。 而基于区块链的隐私计算与其他类型的隐私计算最根本的不同在于,底层技术区块链是去中心化的,排除可信第三方(TTP)。 事实上,合规性尚不明确正是阻碍隐私计算大规模商用的主要因素之一。
▼ 使用方自主私有计算资源接入,自主管控机器资源和编译环境以及缓存等。 腾讯云代码分析分别提供客户端的二进制包和Docker镜像,使用方可自由选择安装到私有计算资源中,无需额外部署,方便快速接入。 腾讯云代码分析公共计算资源无法满足需要: 1.公共计算资源有限,大量团队共享计算资源,必然会产生任务排队执行。 3.公共计算资源条件,不提供macOS和windows,依赖这些OS的工具只能在自主私有的计算资源中使用,才能获得最佳效果。 4.公共计算资源安全,需要使用编译型工具进行代码分析,因涉及使用方信息安全,安全原则限定只能在私有计算资源中使用。 综上,私有计算资源能提升任务效率,能使用更多工具,私有化计算保障信息安全。
除了依靠法律制度保护隐私,还有必要将隐私保护的数学理论和现实需求相结合,将隐私保护技术和计算任务相结合,在大数据分析和机器学习广泛应用的现实情况下,运用多种技术手段解决隐私泄露问题。 隐私计算便是解决这类问题的核心研究课题。 因此,学习隐私计算的相关技术,建设隐私计算平台和系统,探索隐私计算的相关应用场景变得越发重要。 《隐私计算》新书重磅上市 由香港科技大学计算机科学与工程系副教授、智能网络与系统实验室主任陈凯教授,加拿大工程院及加拿大皇家科学院两院院士、微众银行首席人工智能官杨强教授共同撰写的《隐私计算》中文专著 呈现相对完整的隐私计算知识体系,系统阐述隐私计算关键技术,包括4大发展阶段,5大应用平台,9大落地实践案例。 02. 理论应用价值兼备。 并介绍了基于隐私计算技术构建的五个前沿隐私计算平台,以及平台的效率问题和常见加速策略。 03. 产业实践案例丰富。
为推动隐私计算产业进一步发展,由中国通信标准化协会指导,中国信息通信研究院(以下简称“中国信通院”)、隐私计算联盟主办的2022隐私计算大会于7月13日在北京召开。 观点二:技术体系扩展,隐私计算概念外延深化 早在2016年,李凤华教授等人提出隐私计算是面向隐私信息全生命周期保护的计算理论和方法。 而今,随着隐私保护的需求越来越重视,隐私计算也称隐私增强计算、隐私保护计算,其范畴逐渐扩大。例如,今年美国发布的法案中定义其为减轻数据处理所产生的个人隐私风险的任何软硬件技术。 因此,我们认为广义的隐私计算是涵盖隐私信息全生命周期过程的所有计算操作,包括任何实现隐私保护前提下数据安全流通共享的技术。 此外,当前隐私计算大部分企业技术方案迥异,导致难以互通,应用方通常需要部署多种产品,而隐私计算的开源会让用户更易达成共识,也有利于隐私计算的互联互通。
隐私计算(Privacy Computing)又称隐私增强计算(Privacy-Enhancing Computation)或机密计算(Confidential Computing),隐私也即是信息安全中的机密性 隐私计算成为新风口 据毕马威推出的《2021隐私计算行业研究报告》显示,隐私计算受大数据融合应用和隐私保护的双重需求驱动,中国市场规模迎来快速发展期。 隐私计算进入商业落地元年 从技术角度看,隐私计算最大的特点是实现数据的“可用不可见”。目前隐私计算领域主流的技术路线包括三类,即多方安全计算(MPC)、联邦学习、可信执行环境(TEE)。 有业内分析人士指出,在保护数据隐私的背景下,2020年成为隐私计算的技术元年,2021年则是隐私计算的商业落地年。 隐私计算发展仍面临挑战 虽然市场潜力巨大,但隐私计算整体还处于初期阶段。 然而,由于隐私计算仅仅避免了原始数据转移的过程,但仍然完成了基于多方数据的计算,使得其在某种程度上依然破坏了消费者的隐私。这正在成为制约隐私计算发展的无法回避的问题。