在我所工作的团队中,日志管理存在一个问题,我们管理了100多台具有异构系统的机器,以及数百个应用程序。
具有不同平台的异构系统: windows、linux、documentum、kofax、websphere、iis等。所有这些系统都有不同的日志格式和日志位置,有些在事件查看器中,大多数在单独的日志文件中。
有时很难弄清楚每个系统都安装了哪些机器,有时机器从空闲的空间里出来,有时找不到日志的位置。
理想情况下,日志应该非常快地被访问,这样我们就可以在故障中协作,立即关闭,减少异常的停机时间。我们应该把它们保存一段时间,这样就可以检测到“后验”中不明显的问题。并且必须保证磁盘空间的自由,生产环境中的系统不应该永远停止。
你知道一个解决方案和/或产品可以帮助在这种情况下吗?
发布于 2009-10-17 14:15:05
如果您可以通过SNMP使您想要记录的数据可用,则像泽诺斯 Core或Nagios/Cacti这样的监视工具允许您从每个系统检索该SNMP数据,记录并绘制该数据,并在超过阈值时生成警报。SNMP的好处在于它可以自由和跨平台地使用。Zenoss Core也是免费的,易于安装。我们只使用它来监视六台服务器,但是它可以扩展到数百台。有些特性需要非免费的企业版。
像扣篮这样的工具是另一种选择。这只是收集原始日志数据(告诉服务器将日志发送到Splunk服务器),对其进行索引并使其可搜索。您可以创建报告、仪表板和警报。它需要更多的设置,而且不是免费的,但是功能强大,因为它是非常自由的形式,并且允许您跨许多服务器关联事件。看看他们的演示录像。
发布于 2009-10-17 15:40:43
我很确定Nagios就是你想去的地方。我们已经在我们的网络上设置了它,它工作得很好。
发布于 2009-10-17 13:38:48
我们使用来自NetApp 2020's的NFS挂载作为中央日志记录点--您仍然需要编写一些代码来查找问题,但至少它们都在较少的地方可以到达。
https://serverfault.com/questions/75480
复制相似问题