文章/答案/技术大牛

发布

社区首页 >问答首页 >没有验证集的自动编码器特征提取？

问没有验证集的自动编码器特征提取？
EN

Data Science用户

提问于 2019-07-04 06:21:48

回答 1查看 267关注 0票数 0

我计划使用自动编码器进行特征提取，然后使用潜在向量进行聚类。

我的自动编码器在我的训练集上表现很好(丢失的小图像和重建的图像看起来与输入非常相似)，但是在验证集上表现出更低的性能。

不使用验证集而只使用培训集是个好主意吗？既然我能达到很好的性能，提取的向量应该是“好的”特征。

如果我使用新的数据，我将需要重新训练模型，但我应该始终能够达到良好的性能，因为新的数据将非常类似于当前的数据

python

deep-learning

autoencoder

回答 1

Data Science用户

发布于 2019-07-04 11:34:22

据我所知，如果训练集的性能高于验证集，那么您可能会担心过度适应。

目前，我假设您的验证集只是培训集数据的一小部分。

注意，如果自动编码器在您的验证集上表现不佳，就不太可能在新数据上达到良好的性能，“因为新数据将与当前数据非常相似”，就像在当前数据上已经没有良好的性能一样。

如果每次需要对自动编码器进行重新训练，那么首先使用自动编码器可能是不值得的。

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/55023

复制

相似问题

问没有验证集的自动编码器特征提取？
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问没有验证集的自动编码器特征提取？EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问没有验证集的自动编码器特征提取？
EN