面向纵向联邦学习的隐私保护数据对齐框架
发布时间:2025-03-31
点击次数:
- DOI码:
- 10.11999/JEIT231234
- 发表刊物:
- 电子与信息学报
- 刊物所在地:
- 北京,中国
- 关键字:
- 纵向联邦学习,数据对齐,隐私保护,可交换加密,同态加密
- 摘要:
- 纵向联邦学习中,各个客户端持有的数据集中包含有重叠的样本ID和不同维度的样本特征,需要进行数据对齐以适应模型训练。现有数据对齐技术一般将各方样本ID交集作为公开信息,如何在不泄露样本ID交集的前提下实现数据对齐成为亟需解决的问题。基于可交换加密和同态加密技术,该文构造了隐私保护的数据对齐框架ALIGN,包括数据加密、密文盲化、密文求交和特征拼接等步骤,使得相同的原始样本ID经过双重可交换加密可变换为相同的密文,并且对样本特征经同态加密后又进行了盲化处理。ALIGN框架能够对参与方样本ID的密文求交,将交集内样本ID对应的全部特征数据进行拼接并以秘密分享形式分配给参与方。相比现有数据对齐技术,该框架不仅能够保护样本ID交集的隐私性,同时能安全地删除样本ID交集外的样本信息。对ALIGN框架的安全性证明表明,除数据规模外,各客户端不能通过数据对齐获得关于对方数据的任何信息,保证了隐私保护策略的有效性。与现有工作相比,每增加10%的冗余数据,ALIGN框架利用所得数据对齐结果可将模型训练时间缩短约1.3秒,将模型训练准确度稳定在85%以上。仿真实验结果表明,通过ALIGN框架进行纵向联邦学习数据对齐,有利于提升后续模型训练的效率和模型准确度。
- 合写作者:
- 谢雨欣, 邓煌昊, 朱祖坤, 张一余
- 第一作者:
- 高莹
- 论文类型:
- 期刊论文
- 通讯作者:
- 高莹
- 卷号:
- 46
- 期号:
- 8
- 页面范围:
- 3419-3427
- ISSN号:
- 1009-5896
- 是否译文:
- 否
- CN号:
- 11-4494/TN
- 发表时间:
- 2024-08-10