在我们的商店里,nagios检查了linux服务器中硬盘的聪明状态,但到目前为止还没有什么用处:当我们收到智能警报时,系统已经有问题了,所以我们已经知道了:)
然后,我们开发了一种常规的做法,在磁盘上运行智能背景自我测试(smartctl -t long,在非高峰时间),并手动跟踪这些数据。我们记录磁盘模型和s/n,上一次测试的日期,重新分配扇区的数目(我们通常尝试改变每个磁盘的>0重新分配扇区),以及磁盘累积的小时的功率,这样我们就可以一目了然地知道哪些磁盘是旧的。
由于系统(以及磁盘)的数量在增加,我们希望自动化运行测试和收集结果的任务。在开始重新发明车轮之前,我开始寻找现有的解决方案,但我没有运气。
在Linux环境下,是否有任何软件可以自动进行智能自我测试并收集结果数据--或者将其集成到一些硬件库存管理系统中?
发布于 2011-12-11 08:18:17
您是否已经通过SNMP轮询这些服务器?如果是这样的话,如果代理是基于NET的,您可以使用它的“扩展”功能(通过NET扩展-MIB)将任意脚本的结果填充到您选择的OID中。
中锋为使用网监视智能数据的wiki提供了一个很好的方法。
如果您还没有收集和存储SNMP,板球是服务器端的一种开放源码的轻量级解决方案,大多数Unix都支持net代理。
发布于 2011-12-11 17:28:17
来自smartd包的智能工具可以按计划运行自我测试,在发生严重事件时发送电子邮件警报,并且可以在指定的更改上运行指定的程序。它还记录对syslog的智能属性更改,logwatch将其包含在其每日报告中(不过,这些报告对机器并不友好)。有关此选项和其他选项,请参见S.M.A.R.T.工具的比较。
https://serverfault.com/questions/339585
复制相似问题