首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ZFS池中的硬盘故障是什么样的,您实际上是做什么的?

ZFS池中的硬盘故障是什么样的,您实际上是做什么的?
EN

Server Fault用户
提问于 2014-08-10 08:14:22
回答 3查看 16.3K关注 0票数 2

人们经常谈论ZFS的理论好处,以及它如何轻易地(RAIDZ1 1/2)硬盘故障,服务器故障有许多这一事实的证明。我正在考虑使用FreeNAS建立一个带有3-5硬盘的NAS,而且我可能每晚备份重要的文档,所以我不能占用超过一个星期的停机时间。

(物理上)一个硬盘怎么会失败?

当ZFS中的硬盘驱动器失败时,ZFS会做什么,特别是FreeNAS?和它一样,SMTP--给你发一封电子邮件,上面写着“替换硬盘1,然后点击okay .完成后.”

FreeNAS需要多长时间才能从RAIDZ2中的2磁盘故障中恢复?

,假设人机交互最少的话,在RAIDZ2设置中,我有多大可能从最糟糕的硬盘故障中恢复过来?

一个外行人可以用图形化的方式从一本高质量的手册或向导中执行恢复吗?

EN

回答 3

Server Fault用户

发布于 2014-11-13 18:51:36

FreeNAS支持S.M.A.R.T监视,因此通常在驱动器失败之前,如果通知设置正确,并且启用了监视,sysadmin将得到关于坏的不可用扇区、过热等的报告。FreeNAS从9.2.1.8版起不支持“热备用”。配置在zpool中的备件可以手动推送以替换失败的驱动器,但是软件中没有任何东西提供流程的自动化。在RAIDZ2中同时发生2次故障时,几乎肯定会出现无法恢复的文件错误。这是因为一种被称为“比特”的过程。当代驱动器通常是3TB+。为了获得比镜像空间更好的利用率,至少要从6个驱动器构建RAIDZ2。现在,如果在剩余的RAID 5中有一个失败的驱动器和vdev容量大于12 TB,比如条带和10^14的URE速率,那么您很可能会遇到一个URE。几乎可以肯定的是,如果驱动器供应商是对的。这将导致这样的消息中的最小值:

代码语言:javascript
复制
~# zpool status -v
  pool: dpool
 state: DEGRADED
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
scan: resilvered 6.90T in 52h5m with 313 errors on Wed Oct 22 17:44:25 2014
config:

        NAME                         STATE     READ WRITE CKSUM
        dpool                        DEGRADED     0     0 5.75K
          raidz2-0                   ONLINE       0     0    78
            c0t50014EE05807CC4Ed0    ONLINE       0     0     0
            c0t50014EE6AAD9F57Fd0    ONLINE       0     0     0
            c0t50014EE204FC5087d0    ONLINE       0     0     0
            c0t50014EE6AADA3B7Cd0    ONLINE       0     0     0
            c0t50014EE655849876d0    ONLINE       0     0     0
            c0t50014EE6AADA3DFDd0    ONLINE       0     0     0
            c0t50014EE6AADA38FFd0    ONLINE      39     0     0
          raidz2-1                   ONLINE       0     0 11.4K
            c0t50014EE6AADA45E4d0    ONLINE   1.69K     0     0
            c0t50014EE6AADA45ECd0    ONLINE     726     0     0
            c0t50014EE6AADA3944d0    ONLINE       0     0     0
            c0t50014EE204FC1F46d0    ONLINE       0     0     0
            c0t50014EE6002A74CEd0    ONLINE       0     0     0
            c0t50014EE2AFA6C8B4d0    ONLINE       0     0     0
            c0t50014EE6002F9C53d0    ONLINE       5     0     0
          raidz2-2                   DEGRADED     0     0     0
            c0t50014EE6002F39C5d0    ONLINE       0     0     0
            c0t50014EE25AFFB56Ad0    ONLINE       0     0     0
            c0t50014EE6002F65E3d0    ONLINE       0     0     0
            c0t50014EE6002F573Dd0    ONLINE       0     0     0
            c0t50014EE6002F575Ed0    ONLINE       0     0     0
            spare-5                  DEGRADED     0     0     0
              c0t50014EE6002F645Ed0  FAULTED      1    29     0  too many errors
              c0t50014EE2AFA6FC32d0  ONLINE       0     0     0
            c0t50014EE2050538DDd0    ONLINE       0     0     0
          raidz2-3                   ONLINE       0     0     0
            c0t50014EE25A518CBCd0    ONLINE       0     0     0
            c0t50014EE65584A979d0    ONLINE       0     0     0
            c0t50014EE65584AC0Ed0    ONLINE       0     0     0
            c0t50014EE2B066A6D2d0    ONLINE       0     0     0
            c0t50014EE65584D139d0    ONLINE       0     0     0
            c0t50014EE65584E5CBd0    ONLINE       0     0     0
            c0t50014EE65584E120d0    ONLINE       0     0     0
          raidz2-4                   ONLINE       0     0     0
            c0t50014EE65584EB2Cd0    ONLINE       0     0     0
            c0t50014EE65584ED80d0    ONLINE       0     0     0
            c0t50014EE65584EF52d0    ONLINE       0     0     0
            c0t50014EE65584EFD9d0    ONLINE       0     0     1
            c0t50014EE2AFA6B6D0d0    ONLINE       0     0     0
            c0t5000CCA221C2A603d0    ONLINE       0     0     0
            c0t50014EE655849F19d0    ONLINE       0     0     0
        spares
          c0t50014EE2AFA6FC32d0      INUSE     currently in use

errors: Permanent errors have been detected in the following files:

名为“重银”的重建过程将取决于单个驱动器的速度及其占用情况。想想25 top /S最高速度。然而,这里是一个实际的例子,多次故障和实际速度为5MB/s -所以我们谈论的周(S)-这些是2TB 7200 RPM WD驱动器。

代码语言:javascript
复制
~# zpool status
  pool: dpool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Thu Nov 13 10:41:28 2014
        338M scanned out of 48.3T at 5.72M/s, (scan is slow, no estimated time)
        32.3M resilvered, 0.00% done
config:

        NAME                                            STATE     READ WRITE CKSUM
        dpool                                           ONLINE       0     0     0
          raidz2-0                                      ONLINE       0     0     0
            gptid/9640be78-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0  (resilvering)
            gptid/97b9d7c5-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/994daffc-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/9a7c78a3-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/9c48de9d-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/9e1ca264-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0  (resilvering)
            gptid/9fafcc1e-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/a130f0df-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/a2b07b02-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/a44e4ed9-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
          raidz2-1                                      ONLINE       0     0     0
            gptid/a617b0c5-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/a785adf7-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/a8c69dd8-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0  (resilvering)
            gptid/aa097d45-a3e1-11e3-844a-001b21675440  ONLINE       0     0     1  (resilvering)
            gptid/ab7e0047-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/acfe5649-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0  (resilvering)
            gptid/ae5be1b8-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/afd04931-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/b14ef3e7-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/b2c8232a-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
          raidz2-2                                      ONLINE       0     0     0
            gptid/b43d9260-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/b5bd6d79-a3e1-11e3-844a-001b21675440  ONLINE       0     0     1  (resilvering)
            gptid/b708060f-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/b8445901-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/b9c3b4f4-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/bb53a54f-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/bccf1980-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/be50575e-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0  (resilvering)
            gptid/bff97931-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
            gptid/c1b93e80-a3e1-11e3-844a-001b21675440  ONLINE       0     0     0
        spares
          gptid/c4f52138-a3e1-11e3-844a-001b21675440    AVAIL
          gptid/c6332a6f-a3e1-11e3-844a-001b21675440    AVAIL

errors: No known data errors

RAIDZ中的数据保护不是用来替换备份的。在具有RAID2保护的PB存储中,仅在头3年内,统计上保证至少会丢失一些文件。因此,复制到第二位是强制性的。FreeNAS支持ZFS发送/接收以及rsync。如果已经设置了监视并注意了通知,那么就很容易启动备用插入到z池中。然而,当前的FreeNAS版本(9.2.1.8)并没有提供一种简单的方法来识别失败磁盘的槽/外壳。您可以查看我关于这个主题的答案:如何确定FreeNAS / ZFS安装程序中哪个磁盘失败

票数 8
EN

Server Fault用户

发布于 2015-03-24 11:52:41

我可以根据个人经验回答以下问题;

您问: FreeNAS需要多长时间才能从RAIDZ2中的2磁盘故障中恢复?

我注意到:我目前正在用另一个新的更大的驱动器替换一个现有的无故障驱动器,使用在卷状态中找到的“替换”命令。

4.67T的数据需要扫描。我得到了30米/S的银牌转会费。我觉得这挺好的。更换驱动器花了大约48个小时。由于数组没有降级,所以我不关心进程中的另一个驱动器失败。

这就是为什么在驱动器发生故障之前更换它们很重要,例如由于智能错误,或者任何类型的写入或读取错误。我也同意Dimitar的观点,即池应该同步到另一个逻辑上独立的设备,最好是每小时一次。

你问:一个外行人能从一个如此高质量的手册或向导中以图形的方式执行修复吗?

我注意到:在我看来,没有。使用FreeNAS/ZFS需要很好的技术技能。

票数 1
EN

Server Fault用户

发布于 2019-08-10 19:35:54

我有一个freenaz 5磁盘raid-z1池3TB驱动器已经超过5年,并且丢失了单个驱动器,一些智能会提醒我其他几次,发现一个驱动器单击或死亡,其中大部分时间,我的数组说,退化。除了YouTube视频之外,还有很多教程可以帮助我们做到这一点。下面几个提示是SN#在关闭以替换它之前使用的降级驱动器的屏幕截图。在Freenas中设置电子邮件警报,以便在文本降级时发送给您。在我的经验中,再银处理大约需要4-12小时,当它退化时不要使用你的数组。如果您需要订购驱动器,请开着它,但不要使用它。我之所以说这是电子产品,当他们运行了很长一段时间,然后你关闭他们,他们冷却可能会有问题。我通常让它运行,只关闭几分钟,以更换驱动器。

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/619346

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档