Home > Achievements in Scientific Research > Paper Publications

Paper Publications
面向纵向联邦学习的隐私保护数据对齐框架

Release time:2025-03-31

Hits:

DOI number:10.11999/JEIT231234

Journal:电子与信息学报

Place of Publication:北京,中国

Key Words:纵向联邦学习,数据对齐,隐私保护,可交换加密,同态加密

Abstract:纵向联邦学习中,各个客户端持有的数据集中包含有重叠的样本ID和不同维度的样本特征,需要进行数据对齐以适应模型训练。现有数据对齐技术一般将各方样本ID交集作为公开信息,如何在不泄露样本ID交集的前提下实现数据对齐成为亟需解决的问题。基于可交换加密和同态加密技术,该文构造了隐私保护的数据对齐框架ALIGN,包括数据加密、密文盲化、密文求交和特征拼接等步骤,使得相同的原始样本ID经过双重可交换加密可变换为相同的密文,并且对样本特征经同态加密后又进行了盲化处理。ALIGN框架能够对参与方样本ID的密文求交,将交集内样本ID对应的全部特征数据进行拼接并以秘密分享形式分配给参与方。相比现有数据对齐技术,该框架不仅能够保护样本ID交集的隐私性,同时能安全地删除样本ID交集外的样本信息。对ALIGN框架的安全性证明表明,除数据规模外,各客户端不能通过数据对齐获得关于对方数据的任何信息,保证了隐私保护策略的有效性。与现有工作相比,每增加10%的冗余数据,ALIGN框架利用所得数据对齐结果可将模型训练时间缩短约1.3秒,将模型训练准确度稳定在85%以上。仿真实验结果表明,通过ALIGN框架进行纵向联邦学习数据对齐,有利于提升后续模型训练的效率和模型准确度。

Co-author:谢雨欣, 邓煌昊, 朱祖坤, 张一余

First Author:gaoying

Indexed by:Journal paper

Correspondence Author:gaoying

Volume:46

Issue:8

Page Number:3419-3427

ISSN No.:1009-5896

Translation or Not:no

CN No.:11-4494/TN

Date of Publication:2024-08-10

Pre One:Efficient Fuzzy Private Set Intersection from Fuzzy Mapping

Next One:轻量级分组密码算法FBC的积分分析