联盟学习中的客户大小不平衡

发布于 2025-02-03 18:49:35 字数 323 浏览 6 评论 0 原文

我使用Federated的Tensoflow在多个文件上应用联合学习。问题是，每个文件中的数据大小（记录数）不同。

在联合学习培训中，每个客户的大小都不同吗？如果有如何克服它？
有没有办法可以看到每个客户在联合计算培训时的表现？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

各自安好 2025-02-10 18:49:35

在联合学习培训中，每个客户的大小都不同吗？如果有如何克服它？

这取决于多种因素，很大的是客户的数据分布。例如，如果每个客户的数据看起来非常非常相似（例如，有效地相同的分布，）使用哪个客户端并不重要。

如果不是这种情况，那么一种常见的技术是限制客户在每个回合中对数据集采取的最大步骤的数量，以促进更多平等的参与培训过程。在TensorFlow和TFF中，可以使用限制最大迭代次数。在TFF中，这可以使用 tff.simulation.datasets.clientdata.preprocess 。在教程中与示例进行了讨论。

有没有办法可以看到每个客户在联合计算培训时的表现？

客户可以返回单个指标以报告其表现方式，但默认情况下不是这样做的。在 metrics_aggregator 默认为 tff.learning.metrics.sum_then_finalize 通常会创建全局指标平均值。没有开箱即用的解决方案，但是可以实现“最终确定”，然后可以满足这一需求。 re-using 并查看源代码对于 sum_then_finalize 作为一个例子，将是一个不错的起点。