我想我可能达到了Netapp所能提供的IO限制,因为我已经在我的集群中添加了更多的服务器,而iowait在每台服务器上都有上升的趋势。
然而,我如何量化这一点呢?如何使用Netapp CLI工具查看当前的IO统计数据?我知道“统计显示”,但没有看到"io“对象或类似的。我怎么知道Netapp应该能提供什么?
如果有人比我更有经验使用Netapp,我将非常感谢您的帮助。
谢谢!
发布于 2015-01-16 21:40:58
查看netapp站点的我的自动支持部分。它有你可以分析的性能数据,以及一些健康检查。
发布于 2015-01-18 00:30:51
您有几个选项可以监视NetApp文件处理程序的性能。这取决于DataOntap的版本。只需执行sysconfig,您就会看到版本。您可以使用OnCommand性能管理器作为集群Ontap的GUI工具。集群Ontap的另一个选项是QoS作为性能监视器。对于7模式,您可以使用systat或statit控制台命令。
发布于 2015-01-21 14:54:01
对于性能问题,根本就没有简单的答案。
您有iops的计数器,可以用sysstat -x显示。
stats show system会给你类似的东西-- NFS/FCP/CIFS ops等等的列表。
然而,就他们自己而言,这些事情是相当武断的--你怎么知道有多少个IOP“太多”了?
我发现最有用的指标是一致性点。再次,回到sysstat -x。文件处理程序编写IO的方式是填充NVRAM缓存。此缓存定期刷新,数据以突发形式写入磁盘。
什么类型的一致性点发生是一个很好的指标,你的系统是否“快乐”。https://kb.netapp.com/support/index?page=content&id=3014024
T means your system is idle. (triggered by timer - not much happened for 10s, so it thought it better destage anyway)
S or Z is a 'forced' cp because of a snapshot/snapmirror op. (and usually isn't a problem)
F or H or L means your system is getting busy. (F is nvram filling with write data, H/L represent high and low watermarks for memory)
B or b means your system is struggling. (Back to back CPs, which means your hitting the limits of your ability to write to disk.不过,这几乎完全是关于写IO的。另一个让您的系统陷入困境的原因是读取IO。可以轻松地缓存写入;必须立即获取读--而且只有在某些情况下才能缓存它们。
您的统计显示计数器将给您disk_data_read和disk_data_written。sysstat -x将给出同样的概念,以及磁盘使用的概念。(但请注意-使用是“跨系统”的,所以不会向您显示是否有一个真正的“热聚合”和“冷”聚合)。
您还可以运行stats show volume来获取每卷IO统计信息。这将使您了解读/写的总数,以及它们将要读/写的卷。它还区分了“读”和“其他”。“其他”可能是相当重要的,也是有问题的。
https://serverfault.com/questions/660167
复制相似问题