联邦学习笔记（三）

作者：手机用户2602909207 | 来源：互联网 | 2023-09-15 18:07

本文首发于FengYu的空间写在前面参考文献《FederatedLearning:Challenges,methods,andfuture,2020》，较为详细

本文首发于Feng Yu的空间

写在前面

参考文献《Federated Learning: Challenges, methods, and future, 2020》，较为详细的介绍当前FL的挑战和解决方法以及未来可能的研究方向或切入点。

Federated Learning: Challenges, methods, and future

摘要

联邦学习在保持数据本地化的同时涉及在远程设备或孤立的数据中心（例如手机或医院）上训练统计模型。在异构网络和潜在大规模网络中进行训练带来了新的挑战，这些挑战要求从根本上区别于大规模机器学习，分布式优化和隐私保护数据分析的标准方法。在本文中，我们讨论了联邦学习的独特特征和挑战，提供了当前方法的广泛概述，并概述了未来的几个方向

因为设备（智能手机、可穿戴设备和自动驾驶车辆）计算力的上升以及对隐私信息转移的担忧，所以将数据保存于本地和网络计算边缘化变得更加有吸引力。 ==>> 边缘计算

正因为在分布式网络下这些设备的存储和计算能力使得利用每台设备上的增强(enhanced)本地资源成为可能，此外，用户隐私信息保存于本地避免了隐私担忧。 ==>> 联邦学习

FL的应用

智能手机
- 单词联想《A. Hard, K. Rao, R. Mathews, F. Beaufays, S. Augenstein, H. Eichner, C. Kiddon, and D. Ramage, Federated learning for mobile keyboard prediction. 2018. [Online]. Available: arXiv:1811.03604》
- 挑战：用户为了保护个人隐私可能不愿意分享数据或者节省手机有限的带宽/电量
- FL有潜力在不损害用户体验或泄露隐私信息前提下在智能手机上启用预测功能
组织机构 --医疗机构
- L. Huang, Y. Yin, Z. Fu, S. Zhang, H. Deng, and D. Liu, LoAdaBoost: Loss-based adaboost federated machine learning on medical data. 2018. [Online]. Available: arXiv:1811.12629
物联网-- 可穿戴设备、自动驾驶车辆、智能家居

FL方法在公司的应用

K. Bonawitz, H. Eichner, W. Grieskamp, D. Huba, A. Ingerman, V. Ivanov, C. Kiddon, J. Konecnyet al., “Towards federated learning at scale: System design,” in Proc. Conf. Machine Learning and Systems, 2019.
M. J. Sheller, G. A. Reina, B. Edwards, J. Martin, and S. Bakas, “Multi-institutional deep learning modeling without sharing patient data: A feasibility study on brain tumor segmentation,” in Proc. Int. MICCAI Brainlesion Workshop, 2018, pp. 92–104. doi: 10.1007/978-3-030 -11723-8_9.

隐私敏感应用

T. S. Brisimi, R. Chen, T. Mela, A. Olshevsky, I. C. Paschalidis, and W. Shi, “Federated learning of predictive models from federated electronic health records,” Int. J. Medical Informatics, vol. 112, Apr. 2018, pp. 59–67. doi: 10.1016/j.ijmedinf.2018.01.007
L. Huang, Y. Yin, Z. Fu, S. Zhang, H. Deng, and D. Liu, LoAdaBoost: Loss-based adaboost federated machine learning on medical data. 2018. [Online]. Available: arXiv:1811.12629

挑战

目标:

m表示总设备数量，p_k>=0 且 SUM(p_k)=1，F_k为第k个设别的本地目标函数

昂贵的通信费用
- 为了使模型适用于联邦网络中设备产生的数据，需要开发通信效率高的方法，该方法可以迭代地发送small message或者将模型更新作为训练过程的一部分，而不是通过网络发送整个数据集
- 进一步减少这种设置下的通信，需要考虑两个关键方面
  - 减少通信回合总数量
  - 减少每个回合发送信息的大小
系统异质性

由于硬件（CPU和内存）、网络连接（3G、4G、5G、WiFi）、能量（电池等级）的差异，因此联邦网络中每个设备的存储、计算和通信能力都各不相同
- 系统级别的特性极大地加剧了诸如straggler mitigation和容错（fault tolerance）之类的挑战；
- 已进行的FL方法有
  - 预计参与人数少
  - 容忍异质的硬件
  - 通信网络中足够坚固以防设备掉落
统计异质性

设备经常以高度不相同的方式在网络上生成和收集数据
- [42]《V. Smith, C.-K. Chiang, M. Sanjabi, and A. Talwalkar, “Federated multi-task learning,” in Proc. Advances in Neural Information Processing Systems, 2017, pp. 4424–4434》数据生成范例违反了分布式优化中经常使用的独立且均匀分布（i.i.d.）的假设，可能会增加问题建模，理论分析和解决方案的经验评估方面的复杂性
- 多任务学习和元学习都支持个性化或特定于设备的建模，这通常是一种更自然的方法来处理数据的统计异构性，以实现更好的个性化
隐私问题
- 安全多方计算SMC
- 差分隐私DP
- 以上方法通常以减少模型表现或系统高效性为代价换取隐私保护，因此平衡两者关系是一个挑战

未来研究方向

极致的通信方案
- 尽管在传统的数据中心环境中已经探索了单次或分而治之的通信方案[29]，但是在大规模和统计异构网络中，这些方法的行为还没得到很好的理解
通信减少与the Pareto frontier
- 联邦训练中减少通信的方法有本地更新和模型压缩，了解这些技术之间的相互关系以及系统分析每种方法的准确性和通信之间的权衡很重要
- 有效的神经网络推理对于FL通信减少技术中是有必要的
新颖的异步模型
- 批量同步方法
- 异步方法（假定延迟有限）
异质性诊断

开放性问题：
- 是否有简单的诊断方法可以快速地预先确定联邦网络中的异质性水平？
- 是否可以开发类似的诊断方法来量化与系统相关的异质性数量？
- 是否可以利用当前或新的异质性定义来设计新的经验和理论上具有改进收敛性的联邦优化方法？
细颗粒隐私限制

在实践中，隐私约束可能在设备之间甚至单个设备的数据点之间都不同，因此有必要将隐私问题细分
- sample-specific privacy[24]《J. Li, M. Khodak, S. Caldas, and A. Talwalkar, “Differentially private meta-learning,” in Proc. Int. Conf. Learning Representations, 2020》
- device-specifiv privacy
超越监督学习之外的
生产化联邦学习

除了本文讨论的主要挑战之外，在生产环境中运行联合学习时还存在许多实际问题。尤其是诸如概念漂移（当基础数据生成模型随时间变化时），昼夜变化（当设备在一天或一周的不同时间表现出不同的行为）之类的问题[14]，以及冷启动问题（当新设备进入网络时）必须小心处理。

[5]《K. Bonawitz, H. Eichner, W. Grieskamp, D. Huba, A. Ingerman, V. Ivanov, C. Kiddon, J. Konecnyet al., “Towards federated learning at scale: System design,” in Proc. Conf. Machine Learning and Systems, 2019.》讨论了生产联邦学习系统中存在的一些与系统相关的实用问题

总结

与传统的分布式数据中心计算和经典的隐私保护学习相比，讨论了联邦学习的独特性质和相关挑战。提供了关于经典结果的广泛调查以及针对联邦环境的最新工作。最后，概述了一些有待进一步研究的未解决问题。提供这些问题的解决方案将需要众多研究社区的跨学科研究。

参考文献

[1] Federated Learning: Challenges, methods, and future, 2020

–fzhiy.更新于2020年9月2日16点51分

推荐阅读

int
2023年7月7日网络安全动态

汇总了2023年7月7日最新的网络安全新闻和技术更新，包括最新的漏洞披露、工具发布及安全事件。 ... [详细]

蜡笔小新 2024-11-23 13:35:48
int
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
js
从迷茫到收获：阿里腾讯实习Offer的求取之路

本文回顾了作者在求职阿里和腾讯实习生过程中，从最初的迷茫到最后成功获得Offer的心路历程。文中不仅分享了个人的面试经历，还提供了宝贵的面试准备建议和技巧。 ... [详细]

蜡笔小新 2024-11-22 19:32:32
select
解决Win10 1709版本文件共享安全警告问题

每当Windows 10发布新版本时，由于兼容性问题往往会出现各种故障。近期，一些用户在升级至1709版本后遇到了无法访问共享文件夹的问题，系统提示‘文件共享不安全，无法连接’。本文将提供多种解决方案，帮助您轻松解决这一难题。 ... [详细]

蜡笔小新 2024-11-22 13:00:07
int
基于OpenCV和Python的边缘检测与四点变换实现

本文介绍了如何利用OpenCV库进行图像的边缘检测，并通过Canny算法提取图像中的边缘。随后，文章详细说明了如何识别图像中的特定形状（如矩形），并应用四点变换技术对目标区域进行透视校正。 ... [详细]

蜡笔小新 2024-11-22 11:31:52
js
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
int
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
int
软件测试行业深度解析：迈向高薪的必经之路

本文深入探讨了软件测试行业的发展现状及未来趋势，旨在帮助有志于在该领域取得高薪的技术人员明确职业方向和发展路径。 ... [详细]

蜡笔小新 2024-11-21 17:32:44
int
Ryanair Expands Frankfurt Operations, Challenges Lufthansa's Dominance

Irish budget airline Ryanair announced plans to significantly increase its route network from Frankfurt Airport, marking a direct challenge to Lufthansa, Germany's leading carrier. ... [详细]

蜡笔小新 2024-11-21 13:09:01
int
Go从入门到精通系列视频之go编程语言密码学哈希算法（二）

Go从入门到精通系列视频之go编程语言密码学哈希算法（二） ... [详细]

蜡笔小新 2024-11-21 10:55:36
int
PostgreSQL与MySQL的语法差异详解

本文详细介绍了PostgreSQL与MySQL在SQL语法上的主要区别，包括如何使用COALESCE替代IFNULL、金额格式化的方法、别名处理以及日期处理等关键点。 ... [详细]

蜡笔小新 2024-11-21 07:40:22
char
Android与JUnit集成测试实践

本文探讨了如何在Android项目中集成JUnit进行单元测试，并详细介绍了修改AndroidManifest.xml文件以支持测试的方法。 ... [详细]

蜡笔小新 2024-11-20 18:30:14
js
DedeCMS 手机端站点配置与优化指南

本文详细介绍如何安装和配置DedeCMS的移动端站点，包括新版本安装、老版本升级、模板适配以及必要的代码修改，以确保移动站点的正常运行。 ... [详细]

蜡笔小新 2024-11-22 18:44:25
js
七大策略降低云上MySQL成本

在全球经济放缓和通胀压力下，降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧，旨在帮助企业有效控制成本，同时保持高效运作。 ... [详细]

蜡笔小新 2024-11-22 10:13:40
select
EasyCriteria 3.0 版本发布

最新版 EasyCriteria 3.0 已正式上线，该版本经过全面重构，带来了多项性能优化与功能增强。更多详情请参阅官方文档：http://uaihebert.com/?p=1898 ... [详细]

蜡笔小新 2024-11-21 10:40:20