我的任务是检测异常(已知或未知)使用机器学习算法,从各种格式的数据,如电子邮件,IMs等。
所有的建议都非常感谢。
发布于 2010-12-01 21:50:10
像贝叶斯滤波器这样的统计过滤器或一些垃圾邮件过滤器所使用的混蛋版本很容易实现。此外,还有很多关于它的在线文档。
最大的缺点是它不能真正探测到未知的东西。您可以使用大量已知数据来训练它,这样它就可以对新传入的数据进行分类。但是你可以把传统的垃圾邮件过滤器颠倒过来:训练它识别合法的数据,而不是非法的数据,这样它不识别的任何东西都是异常的。
发布于 2016-01-08 10:11:46
有不同类型的异常检测算法,取决于数据类型和您试图解决的问题:
(免责声明:我是Anodot的首席数据科学家,一家为时间序列数据进行实时异常检测的商业公司)。
https://stackoverflow.com/questions/4329407
复制相似问题