
上QQ阅读APP看书,第一时间看更新
第6章
纵向联邦核学习算法
对于真实世界中的数据挖掘任务而言,多个参与方常常保存有一个公共数据的多个不同特征部分。这种类型数据一般称为纵向划分数据(Vertically Partitioned Data)。伴随着隐私保护的巨大需求,我们很难通过传统的机器学习算法对这种纵向划分数据进行数据挖掘。考虑到很少有文献针对非线性方法尤其是核方法进行设计,我们在本章提出了一种纵向联邦核学习(Vertically Federated Kernel Learning,VFKL)算法来训练纵向划分数据。具体来说,我们首先用随机傅里叶特征(Random Fourier Feature,RFF)来近似核函数,然后利用特殊设计的双随机梯度更新预测函数,同时从技术层面保证在数据和模型端不泄露隐私(比如标签等信息)。理论上,VFKL算法可以提供次线性收敛速度,同时在常见的半诚实假设中保证数据的安全性。我们在多个大规模数据集上设计了众多实验来说明VFKL算法的有效性和优越性。