首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何测试我的SAS控制器卡?

如何测试我的SAS控制器卡?
EN

Server Fault用户
提问于 2021-12-01 21:54:19
回答 1查看 272关注 0票数 0

我需要测试我的戴尔SAS控制器卡。自去年7月以来,我在Raidz2安装上看到了太多错误,而不太可能是真的。就好像一辆又一辆的车不停地偏离轨道。

我有一个所谓的“戴尔”9207-8l。我是在2020年7月/8月从ebay上买到的。https://www.ebay.com/itm/132663136462我从未能够输入它的配置。它说按Ctrl + C键输入config。我尝试了左,右crtl,加上c,也用C(大写),因为它的拼写大写。它说它将在安装后进入配置,但永远不会,如果del被按下,它就直接进入bios,否则就会启动。

我在rhelx64上运行了linux上的zfs。昨天吃了蛋糕。我不得不拔出一些2TB设备(6)并制造到目前为止的3 to,以支持失败的系统,同时经历一种RMA地狱。

代码语言:javascript
复制
# zpool status                                                                               
pool: nas
state: DEGRADED                                                                                          status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Wed Dec  1 05:41:15 2021
        665G scanned at 24.5M/s, 640G issued at 23.6M/s, 9.78T total
        182G resilvered, 6.40% done, 4 days 16:52:09 to go
config:

        NAME                          STATE     READ WRITE CKSUM
        nas                           DEGRADED     0     0     0
          raidz2-0                    DEGRADED     0     0     0
            scsi-35000c50093a9052f    DEGRADED     0     0    52  too many errors
            replacing-1               DEGRADED     0     0    52
              scsi-35000c50084818db7  OFFLINE      0     0     0
              lvzfs2-lvzfsvol2        ONLINE       0     0     0  (resilvering)
            scsi-35000c50093a9182b    DEGRADED   235   636    52  too many errors
            scsi-350000c0f01e5dabc    DEGRADED     0     0    60  too many errors
            scsi-35000c5008491a803    DEGRADED     0     0    53  too many errors  (resilvering)
            replacing-5               DEGRADED     0     0    52
              scsi-35000c50084889cf3  OFFLINE      0     0     0
              lvzfs1-lzfsvol1         ONLINE       0     0     0  (resilvering)
            scsi-35000c50093a8dfe7    DEGRADED     0     0    52  too many errors
        spares
          lvzfs3-lvzfsvol3            AVAIL

errors: Permanent errors have been detected in the following files:

        :<0x0>
root@merlin ~$

这种再银已经持续了一两个月,在某种程度上。实际上,THings在短时间内看起来很好,当下一个驱动器出现故障时,或者以前已知的失败驱动器(dev/零d)再次失败。

这简直把我逼疯了,同时也吓到了我,因为这些数据是最重要的。它的家庭照片可以追溯到1970年的S和之前,等等.

请帮帮忙?

编辑:我添加了一个关于我实际使用驱动器的评论,在这里,https://www.reddit.com/r/audiophile/comments/bxw38m/bass_振动_和_电脑_硬性_驱动器/hnvbyj0 0/,因为我还担心HardHouse和Tidy曲目正在用几个低音炮将驱动器分开。会考虑把服务器从办公室搬到车库里。我还使用sata端口和旧2Tb驱动器创建了一个新的zfs池,目前还没有出现任何问题。尽管我已经进行了调优,甚至把一些数据集移到了另一个池,但我仍然处于重新银幕的地狱中。

代码语言:javascript
复制
root@merlin ~$ zpool status
  pool: bak
 state: ONLINE
  scan: none requested
config:

        NAME                                          STATE     READ WRITE CKSUM
        bak                                           ONLINE       0     0     0
          ata-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332    ONLINE       0     0     0
          ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P0891973  ONLINE       0     0     0

errors: No known data errors

  pool: nas
 state: DEGRADED
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Mon Dec  6 11:08:12 2021
        7.84T scanned at 37.5M/s, 7.84T issued at 37.5M/s, 9.78T total
        3.39T resilvered, 80.16% done, 0 days 15:03:25 to go
config:

config:

        NAME                          STATE     READ WRITE CKSUM
        nas                           DEGRADED     0     0     0
          raidz2-0                    DEGRADED     0     0     0
            scsi-35000c50093a9052f    DEGRADED     0     0     0  too many errors
            replacing-1               ONLINE       0     0     0
              scsi-35000c50084818db7  ONLINE       0     0     0  (resilvering)
              lvzfs2-lvzfsvol2        ONLINE       0     0     0  (resilvering)
            replacing-2               DEGRADED     0     0     0
              17084797086424522076    UNAVAIL      0     0     0  was /dev/disk/by-id/scsi-35000c50093a9182b-part1
              scsi-350000c0f012efb7c  ONLINE       0     0     0  (resilvering)
            scsi-350000c0f01e5dabc    DEGRADED     0     0     0  too many errors  (resilvering)
            scsi-35000c5008491a803    DEGRADED     0     0     0  too many errors
            replacing-5               DEGRADED     0     0     0
              scsi-35000c50084889cf3  DEGRADED     0     0     0  too many errors  (resilvering)
              lvzfs1-lzfsvol1         DEGRADED     0     0     0  too many errors  (resilvering)
            scsi-35000c50093a8dfe7    DEGRADED     0     0     0  too many errors

errors: 2 data errors, use '-v' for a list

FYI,存在校验和错误,但这些错误在重新启动后清除。

错误是如此之少,以至于我对ZFS的健壮性印象深刻,这就是为什么我继续在我的主要备份中使用它。总比备份到单个磁盘好。

我犯的另一个错误是,我有5个新驱动器在这里坐了将近一个星期,但我不能使用它们,直到LVM vols完成重放,因为我非常接近数据错误,所以我想先完成,我想先完成,因为我没有等待驱动器到达邮件,在我随意运行替换操作之前,我没有意识到完成所有这些恢复操作需要几个星期。疯狂的疯狂!

我做了一些冰川存储的计算(0.004/GB),这将花费20个月的5TB,不是一个选择。如果我需要这些数据的话,忘了出口的费用吧。此外,我非常喜欢这一点,为此在主服务器上使用ZFS。以前的阵列驱动器是8年前,当被拆除时,我只在整个数组上使用了已知的坏驱动器,并且仍然设法z2我的成功之路。我认为一组新的旋转或新的驱动器将解决这个问题。对不起,我想发泄一下,我想听听更多关于我可能做错了什么的话。

顺便说一句,我确实让公司支付了(在这种情况下是深度折扣服务器)的更换驱动器,不同的型号。不再有IBM给我带来麻烦了。去测试HGST,因为那些过去对我很有用。

请放心,一张新的SAS卡将在路上,如果那些是显示问题,一旦这种再银疯狂结束,如果它曾经这样做。我必须做另一个完整的备份,如果不是,这几乎需要的时间是一样长的,因为.至少我已经将活数据从数组中移出了,所以除非我在其他系统中丢失了主驱动器,否则不会发生丢失.我想我可以说,数据是非常重要的,但我仍然有它的副本,但我现在可以忍受损失。澄清“重要”部分,如果ZFS数组确实开始抛出错误,这将是紧急的,因为这里和那里只有一个驱动器,其中包含主副本。

EN

回答 1

Server Fault用户

发布于 2021-12-01 22:02:44

我需要测试我的戴尔SAS控制器卡。

很简单。用另一个代替。那你就知道这张卡是否有问题了。

什么都没有?我们能回到网站规则中的“专业精神”和“最佳实践”吗?请一家公司去做(并付钱)。替换测试几乎是确保它不是部件故障的唯一方法(当然也是最有效的)。

因为数据是最重要的。它的家庭照片可以追溯到1970年的S和之前,等等.

除了这个话题之外..。

...it对你来说一点也不重要。我用的是“把钱放在嘴边”。如果这对你很重要的话,它就会被备份。我的意思是,我在30多年前在学校学到了备份是一种思考,也是必须的。所以,当你最终拒绝做人们对重要数据所做的事情时,不要带着“重要”。开始实现备份--大量非常低成本的服务。

票数 3
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/1085125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档