干货 | 《联邦学习FATE入门与应用实战》第二课直播回顾!课件详情看这里
FATE是全球首个工业级的联邦学习开源框架,旨在提供安全的计算框架来支持联邦 AI 生态,其在实践生产中有着丰富的应用。
这个3月,微众银行与VMware以及机器之心联合开展了主题为《联邦学习FATE入门与应用实战》的课程,用4周6节课的时间帮助大家在较短周期内完成联邦学习从学到用的全过程。
【联邦学习FATE课程第二期】快速部署FATE开发环境
以上为第二期课程《FATE 的部署模型以及基于 Docker-Compose 快速部署联邦学习开发实验环境》回顾,已在 3 月 12日由VMware 研发工程师陈家豪为大家完成分享。
第 2 课精选问答
问题 1:”toy_example”跑不通原因是什么?
因为FATE的架构比较复杂,加上系统和网络不稳定性等客观原因,一遍下来某些步骤有不可控的小问题。这些问题可以逐步去排除,但是我们推荐比较简单的方法是可以重新跑一遍或几遍。如果还是不行那就定位下是否指令集不支持的问题,详情请参考我们kubeFATE在github上的wiki。
问题2:Exchange也负责模型聚合吗,还是只负责建立底层通信?
它是不负责模型聚合的,只负责通讯。
问题3:目标机和部署机啥区别?
我们前面说KubeFATE的使用其实分为两个部分,一个部分是生成启动集群的配置文件。另外一个部分就是运行的FATE集群。部署机就是生成配置文件的机器,目标机是运行集群的机器。部署机和目标机只是一个逻辑上的划分,他们实际上可以是同一台服务器。
问题4:每个party都是有自己的k8s集群么?
其实取决于你是哪种部署方式,如果是docker-compose的话,你就不需要有k8s集群了。
问题5:这些party里有分中心机构和参与机构吗?
没有严格的区分,一个party即可以做分享数据的中心机构,也可以做参与机构,这取决于训练的具体内容。
问题6:如何实现分布式训练?
分布式训练由EggRoll模块提供支持,它向上提供了一个MapReduce的功能。
问题7:kubefate支持容灾吗,节点挂了怎办?
如果是使用k8s部署的话,那么容灾其实是依赖于k8s。节点挂也没关系,k8s会帮你重新起一个。
问题8:一个party有多个用户吗?
一个party可以有多服务多个用户,这是没问题。
以下为第二期课程的演讲课件,希望各位能有所收获
作为一个开源社区,我们也欢迎社会各行业领域人士加入社区建设,共同打造更好的联邦学习开源框架。如对FATE有任何想法、建议、意见或其他想咨询的,欢迎扫描下方二维码,添加FATE小助手进行沟通。