文章/答案/技术大牛

发布

社区首页 >问答首页 >Tensorflow联合图像分类示例#Epochs有主要影响。模型是否过度拟合？

问Tensorflow联合图像分类示例#Epochs有主要影响。模型是否过度拟合？
EN

Stack Overflow用户

提问于 2020-05-28 19:26:54

回答 1查看 140关注 0票数 1

我一直试图在TF Federated的联合学习图像分类笔记本教程上描述学习过程(准确性和损失)。

我看到通过修改epoch超参数，收敛速度有了很大的提高。从5，10，20等改变时期。但我也看到训练精度的大幅提高。我怀疑过拟合正在发生，尽管然后我评估了测试集的准确性仍然很高。

想知道发生了什么事。？

我的理解是，纪元参数控制每轮训练中每个客户的前进/后退道具的数量。这是正确的吗？因此，在10个客户上进行10轮培训，10个时期将是10个时期×10个客户×10轮。意识到需要更大范围的客户端等，但我预计在测试集上会看到较差的准确性。

我能做些什么来看看发生了什么。我可以使用学习曲线之类的评估检查来查看是否发生了过拟合吗？

test_metrics = evaluation(state.model, federated_test_data)似乎只给出了一个数据点，我如何才能获得每个经过验证的测试示例的单独测试精度？

deep-learning

tensorflow-federated

machine-learning

回答 1

Stack Overflow用户

发布于 2020-05-29 20:54:36

增加客户端时期的数量确实可以提高每轮收敛速度；但您绝对正确，存在过度拟合的风险。

在联合平均算法中，客户端时期的数量决定了每个客户端在更新全局模型之前进行的“顺序进度”(或学习)的量。更多的历元将导致每轮更多的局部进展，这可以表现为更快的每轮收敛速度。然而，将这一点与所有客户端上看到的示例数量进行比较，可能会显示出更相似的收敛速度。

在联邦优化设置中，存在新的过度拟合风险，这可能与每个客户端数据集的非IID程度相关。如果每个客户端数据集具有与全局数据分布相同的分布，则可以使用用于非联邦优化的相同实践。每个客户端数据集与“全局”数据集越不相似，当在后面的轮次中使用大量客户端时期时，就越有可能出现“漂移”(客户端收敛到不同的最佳点)。在这种设置下，训练精度仍然很高，因为每个客户在本地训练期间都很好地适应了自己的本地数据。然而，测试精度不太可能提高，因为全局模型平均值可能会非常小(不同的客户端-局部最优点相互抵消)。Praneeth et. al对此进行了一些讨论。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62063550

复制

相似问题

问Tensorflow联合图像分类示例#Epochs有主要影响。模型是否过度拟合？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow联合图像分类示例#Epochs有主要影响。模型是否过度拟合？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Tensorflow联合图像分类示例#Epochs有主要影响。模型是否过度拟合？
EN