首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >当前状态监测与故障预测系统的不足

当前状态监测与故障预测系统的不足
EN

Server Fault用户
提问于 2016-01-23 06:46:34
回答 1查看 1.6K关注 0票数 1

我有一个问题,哪些好的解决方案(软件/硬件)已经开发和应用于企业的在线故障预测?Zabbix,Openstb,Cacti和类似的替代品?你能再列出一些吗?你能描述一下他们在故障预测方面的优势和劣势吗?

我想了解它们的缺点,并通过模型\算法进行一些改进。如果您对在线故障预测的概念不太了解,请参考以下描述。如果你已经知道了,就跳过吧。

Online failure prediction -- It is an approach to evaluate whether an incoming failure will occur in the near future, and when the failure will occur, and in which component (maybe software or hardware) the failure will occur. It's a short-term prediction by tracking failure, detected error reporting, undetected errors' symptoms, faults's auditing (actively searching the faults, for example, search inodes' inconsistency in Linux filesystems).

本文对https://s3-us-west-2.amazonaws.com/mlsurveys/88.pdf作了更详细的介绍和相关的介绍。

非常感谢!

EN

回答 1

Server Fault用户

发布于 2016-01-23 10:14:10

监测系统比较:https://en.wikipedia.org/wiki/Comparison_的_网络_监控_系统

我不认为某些监控系统有故障预测。你提供的论文太学术了。您仍然可以在某些监视系统的顶部构建它,这将为您的故障算法预测提供数据/事件/故障。

一些监测系统有:

  • 度量预测(趋势预测)。这不是一个失败的预测。不错的半学术论文有Zabbix关于它- Zabbix预测
  • 异常检测--这又不是预测,而是检测。最著名的异常检测系统是天际线。基于RRD的系统(Cacti)使用RRD 霍尔特温特算法。石墨也有一些数学函数,可用于异常检测。

如果要实现/改进故障检测,请将其改为通用的:

  • 输入层-一些插件的概念,因此用户应该能够使用/编写自己的插件,这将从插件特定的监控系统中提取数据。
  • 故障检测层-有许多算法,因此每个算法都应该是可配置的。
  • 输出层-类似于输入层,因此有关预测故障的事件可以返回到监视系统或其他警报系统。

请让它的用户(非学术性)友好,并使用Github。当你需要测试的时候。:-)

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/751205

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档