Home > Achievements in Scientific Research > Paper Publications
Release time:2025-03-31
Hits:
DOI number:10.11999/JEIT231234
Journal:电子与信息学报
Place of Publication:北京,中国
Key Words:纵向联邦学习,数据对齐,隐私保护,可交换加密,同态加密
Abstract:纵向联邦学习中,各个客户端持有的数据集中包含有重叠的样本ID和不同维度的样本特征,需要进行数据对齐以适应模型训练。现有数据对齐技术一般将各方样本ID交集作为公开信息,如何在不泄露样本ID交集的前提下实现数据对齐成为亟需解决的问题。基于可交换加密和同态加密技术,该文构造了隐私保护的数据对齐框架ALIGN,包括数据加密、密文盲化、密文求交和特征拼接等步骤,使得相同的原始样本ID经过双重可交换加密可变换为相同的密文,并且对样本特征经同态加密后又进行了盲化处理。ALIGN框架能够对参与方样本ID的密文求交,将交集内样本ID对应的全部特征数据进行拼接并以秘密分享形式分配给参与方。相比现有数据对齐技术,该框架不仅能够保护样本ID交集的隐私性,同时能安全地删除样本ID交集外的样本信息。对ALIGN框架的安全性证明表明,除数据规模外,各客户端不能通过数据对齐获得关于对方数据的任何信息,保证了隐私保护策略的有效性。与现有工作相比,每增加10%的冗余数据,ALIGN框架利用所得数据对齐结果可将模型训练时间缩短约1.3秒,将模型训练准确度稳定在85%以上。仿真实验结果表明,通过ALIGN框架进行纵向联邦学习数据对齐,有利于提升后续模型训练的效率和模型准确度。
Co-author:谢雨欣, 邓煌昊, 朱祖坤, 张一余
First Author:gaoying
Indexed by:Journal paper
Correspondence Author:gaoying
Volume:46
Issue:8
Page Number:3419-3427
ISSN No.:1009-5896
Translation or Not:no
CN No.:11-4494/TN
Date of Publication:2024-08-10