大数据

• •    

联邦元学习综述

张传尧1,2,司世景1,王健宗1,肖京1   

  1. 1. 平安科技(深圳)有限公司,广东 深圳 518063;

    2. 中国科学技术大学,安徽 合肥 230026

  • 作者简介:张传尧(1998- ),男,中国科学技术大学硕士研究生,平安科技(深圳)有限公司算法工程师,主要研究方向为元学习和联邦学习。 司世景(1988‒ ),男,博士,平安科技(深圳)有限公司资深算法研究员,深圳市海外高层次人才。美国杜克大学人工智能博士后,中国计算机学会会员,主要研究方向为机器学习和及其在人工智能领域应用。 王健宗(1983‒ ),男,博士,平安科技(深圳)有限公司副总工程师,资深人工智能总监,联邦学习技术部总经理。美国佛罗里达大学人工智能博士后,中国计算机学会高级会员,中国计算机学会大数据专家委员会委员,曾任美国莱斯大学电子与计算机工程系研究员,主要研究方向为联邦学习和人工智能等。 肖京(1972‒ ),男,博士,中国平安集团首席科学家,2019年吴文俊人工智能杰出贡献奖获得者,中国计算机学会深圳分部副主席。主要研究方向为计算机图形学、自动驾驶、3D 显示、医疗诊断、联邦学习等。

Federated Meta Learning: A Review

ZHANG Chuanyao1,2, SI Shijing1, WANG Jianzong1, XIAO Jing1   

  1. 1. Ping An Technology (Shenzhen) Co., Ltd., Shenzhen 518063, China

    2. University of Science and Technology of China, Hefei 230026, China

摘要: 随着移动设备的普及,海量的数据在不断产生。由于数据隐私政策的细化,数据的流动和使用受到严格监管。联邦学习可以打破数据壁垒,联合利用不同客户端数据进行建模。由于用户使用习惯不同,不同客户端数据之间存在很大差异。如何解决数据不平衡带来的统计挑战,是联邦学习研究的一个重要课题。利用元学习的快速学习能力,为不同数据节点训练不同的个性化模型来解决联邦学习中的数据不平衡问题成为一种重要方式。本文从联邦学习背景出发,系统介绍了联邦学习的问题定义,分类方式,以及联邦学习所面临的三个主要问题:隐私保护,数据异构,通讯受限。然后从联邦元学习的背景出发,系统介绍了联邦元学习在解决联邦学习数据异构,通信环境受限,提高面对恶意攻击鲁棒性方面的研究工作,并对联邦元学习的工作进行了总结展望。

关键词: 联邦学习, 元学习, 数据异构, 联邦元学习, 隐私保护

Abstract:

With the popularity of mobile devices, massive amounts data are constantly produced. However, due to the refinement of data privacy policies, the flow and use of data are strictly regulated. Federated learning can break data barriers and use client data for modeling. Because users have different habits, how to solve the statistical challenge caused by the data imbalance becomes an important topic in federated learning research. Using the fast learning ability of meta learning, it is an important way to train different personalized models for different clients to solve the problem of data imbalance in federated learning. Based on the background of federated learning, this paper systematically introduces the definition and classification of federated learning, as well as the three main problems of federated learning: privacy protection, data heterogeneity and limited communication. Then starting from the background of federated meta learning, this paper systematically introduces the research work of federated meta-learning in solving the heterogeneous data, the limited communication environment, and improving the robustness against malicious attacks. Finally, we make a summary and prospect of the work of federated meta learning.

Key words: Federated learning, Meta learning, Heterogeneous data, Federated meta learning, Privacy protection

[1] 刘峰,吕晓鹏,夏宏飞,许建国. 改善LT码性能的预译码集优化方法研究[J]. 电信科学, 2009, 25(12): 17 -23 .
[2] 张曼君,裴昌幸. 安全的公平非否认协议研究[J]. 电信科学, 2009, 25(12): 31 -35 .
[3] 王 沁,李 翀,万亚东,李 磊. 实时管理约束下节点级低功耗数据融合技术[J]. 通信学报, 2008, 29(11): 28 -226 .
[4] 王丽丽,冯 涛,马建峰. 协议组合逻辑安全的4G无线网络接入认证方案[J]. 通信学报, 2012, 33(4): 11 -84 .
[5] 胡学龙,王志坚,王丽萍. 基于分数低阶统计量的最佳韧性混合p-范数滤波算法研究[J]. 通信学报, 2007, 0(08A): 7 -37 .
[6] 刘亚丽,殷新春,陈决伟. 基于ElGamal体制的前向安全盲签名方案[J]. 通信学报, 2007, 0(08A): 10 -53 .
[7] 李建军1,2,郁滨1,陈武平2. 面向服务组合的密码服务调度智能优化研究[J]. 通信学报, 2013, 34(Z1): 28 -222 .
[8] 谢晓军,胡军军. 电信运营商BOSS建设流程分析与探讨[J]. 电信科学, 2014, 30(6): 29 -32 .
[9] 赵 毅,龚 俭,杨 望. 恶意代码自动分析系统的研究[J]. 通信学报, 2014, 35(Z1): 11 -57 .
[10] 殷新春,杨 洁,谢 立. 密钥控制的多S盒Rijndael算法[J]. 通信学报, 2007, 28(9): 19 -132 .