首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用自动编码器对图像进行离群点检测

如何使用自动编码器对图像进行离群点检测
EN

Data Science用户
提问于 2018-10-11 19:28:51
回答 3查看 1.8K关注 0票数 0

我有一堆从照相机上拍摄的图像,显示一个管道,并想要检测管道是否漏水。在数据集中很少有漏水管道的例子。因此,考虑到这个问题是一个监督学习问题,我认为由于数据不平衡,它可能不会给我们带来好的结果。我正在考虑使用自动编码器,并认为它是一个孤立点检测问题。

我刚开始深入学习,所以我想知道我的神经网络的结构应该是什么样子。我应该先有一些卷积层,然后是一个自动编码器,还是应该只有一个自动编码器?对于这样一个用例,什么是最好的深层次学习库?我也在考虑只使用那些在训练阶段没有泄漏的照片,可以吗?

EN

回答 3

Data Science用户

发布于 2018-11-02 10:02:07

如果你使用监督学习,你需要加权你的标签(这里)。

否则,我强烈建议排除CAE训练数据集的每个泄漏图像。如果您的训练数据集中有异常,您的CAE将学习它作为正常。这实际上是一个活跃的研究领域,对于真实的数据集来说并不是微不足道的,但是如果您拥有管道的静态图像,这应该是很容易的。我建议你使用传统的简历,而不是DL模型,因为你可以解释和微调结果。

票数 0
EN

Data Science用户

发布于 2018-11-02 10:35:38

你的解释不够充分。如果您有相同的图像,具有相同的背景,这意味着您可以使用简单的图像差异来查找更改和检测泄漏。

票数 0
EN

Data Science用户

发布于 2019-09-07 10:12:51

一个想法是训练你的自动编码器,只有一个正常的图像,这将允许你在一个较低的空间表示问题。您的图像将按以下方式编码,用于x \in \mathbb{R}^{W \times H \times C}

f(x) = \tilde{x} \in \mathbb{R}^{1 \times d}

然后,由于您位于较低维空间,您可以使用基于距离的规则:您的正常情况应该在某个球中累积:

\{ ||x-u|| < \varepsilon \}

在那里u将是中心(所有正常训练案例的平均值)。然后使用火车模型在预测时间对图像进行编码。如果一个新的点在球里面,这是一个正常的情况,如果它在外面,它是一个离群点。

这只是一个想法,我认为有很多可能的方法来解决这个问题。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/39553

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档