首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于监督学习的猫行为异常检测

基于监督学习的猫行为异常检测
EN

Data Science用户
提问于 2018-09-24 12:12:00
回答 1查看 156关注 0票数 4

几位同事和我正在浏览最近被取代的“猫”,我们在工作中有过这样的经历。对于那些好奇的人来说,这句话中的“猫”指的是一种特殊类型的泵,叫做猫泵。它被亲切地称为‘小猫’,因为我们只有一个这样的泵。

经过一次例行检查后,我注意到很多时候小猫的表现不太好。这在数据集中被标记为猫异常。

(如果有人希望进一步分析,可在此查阅:

https://drive.google.com/open?id=1e0OhzhaSZP9_A3QdaK9-BvWXbRPZacED)

这就是它异常时的样子:

本质上,它看起来像一个正弦的图案,是轻微的弯曲。我还注意到,当它是一种异常状态时,它的聚集点看起来很紧。

使用Python的Sklearn库和一些很好的老式信号处理,我决定删除一些嘈杂的集群,这样我就可以看到没有噪音的信号是什么样子的。为此,我对数据执行了一个Savitzy-Golay过滤器,它已经平滑了这一点,如下所示。

然后,我使用一个特性从“普通”cat值中减去这些值--“平滑的”cat值,这给了我一个粗略的指示“集群”何时出现。

这是可以接受的(大约90%的准确性),当我将这个特性加入随机森林模型时,我可以在一定程度上发现异常,但我觉得我使用的“聚类”方法非常笨拙,并且有更好的方法来捕获猫信号的“噪音”作为一个变量。

因此,现在我正在寻找一种更好的方法来识别和区分“不正常”的猫行为。

因此,作为捕捉“嘈杂”集群的一个更好的特性或变量,是否还有其他人对如何捕捉这一特性有任何改进意见?

EN

回答 1

Data Science用户

发布于 2018-09-24 15:35:45

你是在什么分辨率下进行分类?在样本水平上?

如果是的话,您的基线模型是什么样子的?例如,您是否尝试过将最近的5-10个原始样本作为特征,并通过这种方式获得多大的准确性?

此外,如果你对输出进行某种“平滑”--例如,假设一个被10个“坏”样本包围的“好”样本也应重新归类为“坏”样本,你可以试着看看会发生什么--因为系统不能那么快地在正常运行模式和错误操作模式之间跳跃。

最后(或者应该是第一位),您的模型在实际应用中所需要的精确性是什么?

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/38721

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档