1、.图联邦学习进展与应用图联邦学习进展与应用史春奇2022 年 7 月 9 日.图联邦学习进展与应用1图联邦的必要性2图联邦的分类3图联邦的经典算法4图联邦的平台架构5图联邦的金融应用6图联邦的发展展望.图联邦学习进展与应用图联邦的必要性联邦学习联邦学习是一种分布式机器学习技术可以在多个分散的边缘设备(手机)或保存本地数据样本的服务器上训练算法,而无需交换它们(训练数据)。从而实现将机器学习的能力与将数据集中存储的需求分离。(source:google).图联邦学习进展与应用图联邦的必要性纵向联邦学习纵向联邦学习是金融机构引入外部数据的重要技术之一纵向联邦学习一般是适用于数据集上具有相同的样本空
2、间、不同的特征空间的参与方所组成的联邦学习场景,纵向联邦学习也可以理解为按特征划分的联邦学习。(source:Qiang Yang).图联邦学习进展与应用图联邦的必要性联邦学习的必要性数据安全合规要求越来越严格数据作为生产要素的重要性越来越高传统的数据合作方法存在重大的合规隐患与效果缺陷.图联邦学习进展与应用图联邦的必要性图联邦的必要性图应用在金融行业的必要性:从金融行业的角度,来看一下跨地区、跨机构、跨账户的资金流、数据流、信息流的挖掘离不开图的应用。图数据在不同数据类型应用的重要性:从数据分类的角度来看,越来越多的数据会应用图来刻画。图在刻画底层数据之间关联关系上的重要性:从联邦划分的角度
3、来看,图在底层数据划分上的刻画能力更具有一般性,因此在描述底层数据之间的关联关系上非常重要。.图联邦学习进展与应用图联邦的必要性图应用在金融行业的必要性车险理赔 SNA 反欺诈流程图(source:金融电子化杂志).图联邦学习进展与应用图联邦的必要性图应用在金融行业的必要性跨境跨机构反洗钱(source:).图联邦学习进展与应用图联邦的必要性图应用在金融行业的必要性私募机构涉嫌联合多账户操纵股价(source:)2013 年 7 月,私募机构华鼎兴业资产管理有限公司涉嫌联合多账户操纵百圆裤业、三江购物、泰亚股份股价.图联邦学习进展与应用图联邦的必要性图应用在金融行业的必要性理财资金被非法挪用(
4、source:)2012 年 12 月间,万家金元 8 亿理财资金被非法挪用.图联邦学习进展与应用图联邦的必要性图应用在金融行业的必要性加密货币交易所被黑客攻击(source:)2019 年 5 月,币安 7,000 枚 BTC 被盗事件.图联邦学习进展与应用图联邦的必要性图数据是表数据之外的一种重要数据类型图的表示图是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E)。传统数据结构中图根据边的方向、连接关系,可以分为无向图,有向图,完全图全链接图.图联邦学习进展与应用图联邦的必要性图数据是表数据之外的一种重要数据类型最常用的信息表示方法是表数据.图联邦学习进展与应用图联邦的
5、必要性图数据是表数据之外的一种重要数据类型图数据成为另一种主流的信息表示方式.图联邦学习进展与应用图联邦的必要性图在刻画联邦数据间关联关系上的重要性图在底层数据之间的关系上的刻画更灵活.图联邦学习进展与应用图联邦的分类图联邦分类的影响受到图的分布,结构,划分,用途的影响受到联邦学习的底座框架的影响.图联邦学习进展与应用图联邦的分类联邦学习的分类按数据拥有方:跨设备、跨机构按数据集组织:横向、纵向、迁移联邦学习(source:Ming Tang and Vincent W.S.Wong)(source:Qiang Yang).图联邦学习进展与应用图联邦的分类联邦学习架构分类CS 架构(仲裁者服务
6、器)P2P 架构委员会架构.图联邦学习进展与应用图联邦的分类联邦学习架构-CS 架构(仲裁者服务器)典型算法包括 FedAvg,FedSGD,SplitNN(source:Qiang Yang).图联邦学习进展与应用图联邦的分类CS 架构下经典学习方式FedAvg,FedSGD,FedProx,Scaffold,FedNova,SplitNN(source:Adaptive Split Learning).图联邦学习进展与应用图联邦的分类CS 架构下经典学习方式即便 CS 架构下,也会收到数据划分方式,适用模型,隐私保护机制的影响。(source:Qinbin Li etc.).图联邦学习进展