指数机制
问题引出
- 在Laplace机制中,我们首先对数据库进行查询,然后再查询结果之上添加一定的噪声使其满足DP的要求。因此,返回的数据通常只是“接近准确”的。那么差分隐私能否允许我们得到真实的结果呢?在这种情况下,指数机制应运而生。
- 指数机制(The exponential mechanism)是为我们希望选择“最佳”响应的情况而设计的,但直接在计算数量上添加噪声可以完全破坏其价值。
变量说明
-
可用性函数
设查询函数的输出域为R,域中每个值r∈R为一实体对象,X为给点的数据集。在指数机制下,函数q(X,r)→R称为输出值r的可用性函数。
-
指数机制的敏感度
Δq=x,x′max∣∣q(x,r)−q′(x′,r)∣∣
则:
Δqq(x,r)−q′(x′,r)⩽Δq∣q(x,r)−q′(x′,r)∣⩽1
结论
-
指数机制ε-差分隐私
选择一个查询q,给定分值函数(Score function)(比如给数据打分投票,分越高,表示这个数据越重要)。指数机制以M(x,q,r)的概率输出结果r。
则,指数分布E(2Δqε)满足ε-差分隐私。
另一种说法:
给定数据集D及可用性函数q(D,r)→R,隐私保护机制M满足ε-差分隐私,当且仅当下述表达式成立:
M(D,q)∝e2Δqε∗q(D,r)
-
指数分布(Exponential Distribution,补充)
指数分布的概率密度函数如下:
f(x)={λe−λx,x>00,x⩽0
记为:X∼E(λ)。
证明
因为结果是以概率输出结果,不是直接对数值数据进行加噪,因此需要归一化以概率表示:
P[ME(x′,q,R)=r]P[ME(x,q,R)=r]=(ri∈R∑e2Δqε∗q(x′,ri)e2Δqε∗q(x,r))(ri∈R∑e2Δqε∗q(x,ri)e2Δqε∗q(x,r))=e2Δqε∗q(x′,r)e2Δqε∗q(x,r)∗ri∈R∑e2Δqε∗q(x,ri)ri∈R∑e2Δqε∗q(x′,ri)
第一个因子,可整理为如下形式:
e2Δqε∗q(x′,r)e2Δqε∗q(x,r)=e2ε∗Δq(q(x,r)−q(x′,r))⩽e2ε∗1=e2ε
第二个因子,可整理为如下形式,(变形技巧来了,):
ri∈R∑e2Δqε∗q(x,ri)ri∈R∑e2Δqε∗q(x′,ri)=ri∈R∑e2Δqε∗q(x,ri)ri∈R∑(e2Δqε∗q(x,ri)∗e2Δqε∗(q(x′,ri)−q(x,ri)))
∵e2Δqε∗(q(x′,ri)−q(x,ri))⩽e2ε
∴ri∈R∑(e2Δqε∗q(x,ri)∗e2Δqε∗(q(x′,ri)−q(x,ri)))⩽e2ε∗ri∈R∑e2Δqε∗q(x,ri)
∴ri∈R∑e2Δqε∗q(x,ri)ri∈R∑(e2Δqε∗q(x,ri)∗e2Δqε∗(q(x′,ri)−q(x,ri)))⩽e2ε∗ri∈R∑e2Δqε∗q(x,ri)ri∈R∑e2Δqε∗q(x,ri)=e2ε∗1=e2ε
综上:
P[ME(x′,q,R)=r]P[ME(x,q,R)=r]⩽e2ε∗e2ε=eε
所以,E(2Δqε)满足ε-差分隐私。
高斯机制实现差分隐私
结论

证明
参考自:
https://tintin.space/2019/04/01/DP/
https://zhuanlan.zhihu.com/p/66008168
https://blog.****.net/Ano_onA/article/details/100550926