高斯机制-暂时还没完全搞懂

差分隐私分类

  • 中心化差分隐私(ϵDP\epsilon-DP
  • 本地化差分隐私(ϵLDP\epsilon-LDP

区别

  1. 中心化差分隐私的随机函数运行在服务器上,而本地化差分隐私运行在本地。
  2. 服务器上具有全局敏感度,而本地查询中任意用户之间并不知晓其他人的数据记录。
  3. 机制选择
    1. 中心化差分隐私一般选择Laplace和指数噪声等方法
    2. 本地化差分隐私主要采用随机响应技术

加噪方式分类

  1. 扰动
    • 对输入数据扰动:随机响应
    • 对输出数据扰动:Laplace机制
    • 中间数据:随机响应或Laplace机制
  2. 采样
    • 核心思想:将数据集分成k份,对每份数据应用Laplace机制或随机响应的算法。
    • 满足差分隐私的组合性质(串行和并行)

高斯机制(Gaussian机制)

  • Laplace机制和指数机制之前有总结过,这里进行补充高斯机制。

  • 消除量纲的操作

l2sensitivityl_2-sensitivity:查询函数ff的敏感度表示相邻数据集输出的最大的l2l_2距离:
Δf=maxD,Df(D)f(D)2 \Delta f = \displaystyle \max_{D,D'}||f(D)-f(D')||_2
高斯机制:对于δ(0,1)\forall \delta \in(0,1)σ>2ln1.25δΔfϵ\sigma > \frac{\sqrt{2 ln \frac{1.25}{\delta}} \Delta f}{\epsilon},有噪声YN(0,σ2)Y\sim N(0,\sigma^2)满足(ϵ,δ)differentialprivacy(\epsilon,\delta)-differential privacy.
P[M(D)S]P[M(D)S]+δ P[M(D)\in S] \leqslant P[M(D')\in S] + \delta
证明:

  1. https://tintin.space/2019/04/01/DP/
  2. 这个证明的前半段至积分部分,是搞懂了。但是后半部分,将问题转换后的证明没搞明白。
  3. 尤其那个cc的范围,着实不懂,而且下面这个部分也挺奇怪的。待解决。

高斯机制-暂时还没完全搞懂

参考自:

https://tintin.space/2019/04/01/DP/