文章/答案/技术大牛

发布

社区首页 >问答首页 >基于监督学习的猫行为异常检测

问基于监督学习的猫行为异常检测
EN

Data Science用户

提问于 2018-09-24 12:12:00

回答 1查看 156关注 0票数 4

几位同事和我正在浏览最近被取代的“猫”，我们在工作中有过这样的经历。对于那些好奇的人来说，这句话中的“猫”指的是一种特殊类型的泵，叫做猫泵。它被亲切地称为‘小猫’，因为我们只有一个这样的泵。

经过一次例行检查后，我注意到很多时候小猫的表现不太好。这在数据集中被标记为猫异常。

(如果有人希望进一步分析，可在此查阅：

https://drive.google.com/open?id=1e0OhzhaSZP9_A3QdaK9-BvWXbRPZacED)

这就是它异常时的样子：

本质上，它看起来像一个正弦的图案，是轻微的弯曲。我还注意到，当它是一种异常状态时，它的聚集点看起来很紧。

使用Python的Sklearn库和一些很好的老式信号处理，我决定删除一些嘈杂的集群，这样我就可以看到没有噪音的信号是什么样子的。为此，我对数据执行了一个Savitzy-Golay过滤器，它已经平滑了这一点，如下所示。

然后，我使用一个特性从“普通”cat值中减去这些值--“平滑的”cat值，这给了我一个粗略的指示“集群”何时出现。

这是可以接受的(大约90%的准确性)，当我将这个特性加入随机森林模型时，我可以在一定程度上发现异常，但我觉得我使用的“聚类”方法非常笨拙，并且有更好的方法来捕获猫信号的“噪音”作为一个变量。

因此，现在我正在寻找一种更好的方法来识别和区分“不正常”的猫行为。

因此，作为捕捉“嘈杂”集群的一个更好的特性或变量，是否还有其他人对如何捕捉这一特性有任何改进意见？

machine-learning

supervised-learning

image-recognition

回答 1

Data Science用户

发布于 2018-09-24 15:35:45

你是在什么分辨率下进行分类？在样本水平上？

如果是的话，您的基线模型是什么样子的？例如，您是否尝试过将最近的5-10个原始样本作为特征，并通过这种方式获得多大的准确性？

此外，如果你对输出进行某种“平滑”--例如，假设一个被10个“坏”样本包围的“好”样本也应重新归类为“坏”样本，你可以试着看看会发生什么--因为系统不能那么快地在正常运行模式和错误操作模式之间跳跃。

最后(或者应该是第一位)，您的模型在实际应用中所需要的精确性是什么？

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/38721

复制

相似问题

问基于监督学习的猫行为异常检测
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于监督学习的猫行为异常检测EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于监督学习的猫行为异常检测
EN