计数器被重置,就像一个计量器在用完整数后滚动过来一样。许多设备控制器会有不同的阈值,但0计数并不意味着驱动器没有错误,就像一辆在里程计上有1000,010公里的汽车不是“刚出生产线”一样。
如果您想构建一个图,如图2所示,您可以编写一个小的数据收集实用程序,从存储设备中读取智能信息,并将其记录在数据库中(或者您认为合适的地方)。智能工具包是我通常用来显示存储设备信息的包。
您可以这样安装它:
- 开放终端(如果尚未打开)
- 安装
smartmontools包: sudo安装smartmontools - 查询一个存储介质,例如,一个NVMe设备: smartctl all /dev/nvme0n1这将给你很多信息: smartctl 7.2 2020-12-30 r5155 X86_64-linux-5.11.0-17-通用版权(C) 2002-20,Bruce,Christian Franke,www.smartmontools.org ===开始信息节===模型编号:三星MZVLW512HMJP-000L7序列号: S359NX0K103156固件版本:7L7QCXY7PCI供应商/子系统ID: 0x144d IEEE标识符: 0x002538总===容量: 512,110,190,592 512 GB未分配NVM容量:0控制器ID:2 NVMe版本:1名称空间1大小/容量: 512,110,190,592 512 GB命名空间1利用率: 81,254,830,080 81.2 GB名称空间1格式化LBA大小:512个命名空间1 IEEE 64: 002538 b181b5c4a3当地时间为:清华5月27日21:57:29 2021 JST固件更新(0x16):3插槽,不需要重置所需的可选管理命令(0x0017):安全格式Frmw_DL Self_Test可选NVM命令(0x001f):Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat日志页属性(0x03):S/H_per_NS Cmd_Eff_Lg警告Comp。临时工阈值: 69摄氏度临界Comp。临时工阈值: 72摄氏度支持的功率状态St Op Max活动Idle RL RT WL WT Ent_Lat Ex_Lat 0+ 7.60W -0 0 0 1+6.0 0 W-1 1 1 0 0 2+5.10 W-2 2 2 0 03-0.0400W温度: 33摄氏度可用备用: 100%可用备用阈值: 10%可用: 1%数据单元读取:20 937 566个10.7结核病数据单元写入:26 780 407 13.7 TB主机读取命令:359 002 242主机写入命令:683 010 154控制器繁忙时间5 130次动力循环:1 027次供电小时:3 812次不安全关闭: 85次媒体和数据完整性错误:0次错误信息日志条目: 719次警告。温度时间:0临界温度。温度时间:0温度传感器1: 33温度传感器2: 39摄氏度误差信息(NVMe日志0x01,( 64项中有16项) Num ErrCount SQId CmdId Status PELoc LBA NSID VS 0 719 0 0x0008 0x4004 -0 0-1 718 0 0 x0008 0x4004 -0-2 717 0 0 x0008 0 x4004-0-3 716 0 0 x0008 0 x4004-0-1 718 0 0 x0008 0 x4004-0-3 716 0 0 x0008 0 x4004-0 0 0-4 715 0 0 x0008 0 x4004-0 0-5 714 0 0 x0008 0 x4004-0 0-6 713 0 0 x0008 0 x4004-0-0-7 712 0 0 x0008 0 x4004-00-8 711 0 0 x0008 0 x4004-0 0-9 710 0 0 x0008 0 x4004-0 0- 10 709 0 0 x0008 0 x4004-0 0- 11 708 0 0 x0008 0 x4004-0 0- 12707 0 0 x0008 0 x4004-0 0- 13 706 0 0 x0008 0 x4004-0 0- 14 705 0 0 x0008 0 x4004-0 0- 15 704 0x0008 0 x4004-0. (48项未阅读)这可能是太多的信息,因此,您可以得到这样的错误计数: smartctl -l error /dev/nvme0n1上面的命令返回与前面命令中的“”部分相同的输出。注意,默认情况下,NVMe设备最多返回16个条目。如果您正在查询包含更多内容的NVMe设备,您可以指定返回的条目数如下: smartctl -l错误,64 /dev/nvme0n1用于我的设备,总共有64个闪存芯片,因此我将在上面的命令中添加
,64。您可以显示多达256个条目的信息。
希望这给你一个丰富的信息来玩和跟踪。