阅读笔记：Analyzing Subgraph Statistics from Extended Local Views with Decentralized Differential Privacy - 代码天地

阅读笔记：Analyzing Subgraph Statistics from Extended Local Views with Decentralized Differential Privacy

其他 2021-02-10 17:11:00 阅读次数: 0

一.概念

1.ELV：用户的连接以及其邻居的连接

例子：2-hop ELV

v ∈ V ,2-hop ELV Gv consists of:

v的1-hop 邻居 : {u | u ∈ V ∧ (u,v) ∈ E}.
涉及v的边 : {e = (v,u) | e ∈ E}.
v的2-hop 邻居:{w | ∃u ∈V,(u,v) ∈ E∧(u,w) ∈ E}.
涉及 v的 1-hop 邻居: {e = (u,w) | e ∈E ∧ (u,v) ∈ E}

2.邻居ELV

G=(V,E), v∈V,它的 ELV Gv ⊆G,G的邻居图G′

v在 G′ 中的ELV，是Gv的邻居 ELV Gv′

两个邻居ELV可能不包含相同的结点，可能有多条边不同

3.去中心化差分隐私

一组结点 V =v1,v2,...vn，一组随机机制 {Mi,1 ≤ i ≤ n} ，共同满足 (ε, δ)-DDP,

对于任意两个邻接图 G = (V,E) and G′ = (V,E′), 任意可能输出的子集 {Si ⊆ range(M), 1 ≤ i ≤ n},

其中 Gi 和 Gi′ (1 ≤ i ≤ n) 是 vi 关于G 和 G′ 的邻居ELVs

二.问题

1.ELV中邻居的敏感连接如何保护，即如何对ELV中的所有参与者使用差分隐私

2.数据收集者如何使用ELV，精确估计全局图属性

3.收集ELV时，直接使用本地差分隐私是不够的

4.有效的数据收集机制 -- 多阶段框架(不直接收集子图，而是分析者询问最小噪音规模，)

三.已有方法

1.本地差分隐私（Local differential privacy）

问题：对手的目标是u，想要发现u和v之间是否连接；然后对手询问u以及他的1-hop邻居，由此得到

一个二进制的值；之后计算二进制的平均值；尽管每个报告满足LDP，但是若查询数量较大，对手有

很高可能性知道u和v之间是否连接

原因：每个用户只考虑自己的信息，没有考虑邻居的信息

2.基线方法--全局敏感度

全局敏感度：

考虑到一个子图模式 g, 每个参与者直接报告它的子图计数值的噪音版本

的敏感度是，敏感度会很高，导致poor结果

高的原因：

考虑g是三角形的情况，，

噪音方差就是

不足：

考虑最坏的场景，不管图的实际结构

方差较大，因为是基于全局敏感度注入噪声

3.多阶段框架--局部敏感度

1）局部敏感度：

比如，三角形计数值，（局部敏感度的最大值即为全局敏感度3(n-2) ）

问题：如果询问每个用户，注入拉普拉斯噪声，是不能满足差分隐私的

原因：结点v1的局部敏感度是1，图1中增加或者移除一条边，仅仅至多改变G1中1个三角形

也就是v1的局部敏感度仅依赖 ELV G1，而不管G1以外的G结构

考虑图G的邻居图 G′，和G相同除了增加了一条边 (v1,v8)

G′ 中 v1的三角形计数值局部敏感度变成2，比如增加边 (v1, v5)，会产生两个三角形

由此产生的问题是：在随机化机制Mi中使用他的真实值会违反差分隐私（感觉在哪里看到过类似的结论，一时想不起来了）

四.创新方法--多阶段框架

1.主要思想

针对上面提出的本地差分隐私不能满足DP，提出噪音规模本身也是隐私信息

给每个结点的子图计数值注入拉普拉斯噪声，但是噪音的规模不是确定的

噪音规模从一个分布中抽样得到，有的可能性 that 注入拉普拉斯噪声可以隐藏任意边存在或者不存在

2.两个阶段

阶段1

使用 (ε1,δ1)-DDP 来收集每个用户的信息，决定合适的噪音规模 λ

λ需要满足两个条件：

(1) 使用(ε1,δ1)-DDP 产生 λ

(2) 至少 1 − δ2 可能性, 满足：

阶段2

询问每个用户报告他的加噪子图计数值，对于一些 ε 和 δ，有至少 1 − δ 可能性满足 ε2-DDP

3.多个阶段

递归使用两个阶段框架，产生多阶段的解决方法

Phase 1分为：Phase 1.1 and Phase 1.2，

Phase 1.1 ：

产生 λ1，

有δ1,2可能性失败，比如输出的噪音规模不是很大，不能让 Phase 1.2满足 ε1,2-DP

估计图计数值的本地敏感性的本地敏感性，有1−δ1,2可能性输出真实的上界

Phase 1.2：

应用拉普拉斯机制，当使用一个正确的噪音规模，满足 ε1,2-DP

使用估计的来输出一个估计的，最多有1 − δ2可能性是真实值

Phase 2：

使用估计的来得到随机子图数

五、证明

1.Phase 1

Phase 1 的输出：(λ,Y)，Y代表所有额外的私人信息除了λ

Sλ：Phase 1的任意可能输出集合

Phase 2 的输出：代表噪音子图计数值集合

证明过程：

想要满足：

s1：

s2: 因为有 >= 1 − δ2 可能性，所以的可能性是 >= 1 − δ2

也就是的可能性是小于 δ2

s3: δ1 < δ，如果已经小于 δ1 ，那么必然也是小于 δ

s4:

s5: 因此，（可能性乘必然小于）

六、参考链接

1.全局敏感度和局部敏感度的区别：https://blog.csdn.net/Ano_onA/article/details/100550926

更新中...

对这篇文章感兴趣，或者对社交网络隐私感兴趣的小伙伴，欢迎加入群讨论哦~

猜你喜欢

转载自blog.csdn.net/nature_ph/article/details/105909814

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)