文章/答案/技术大牛

发布

问RAID 0用于开发
EN

Server Fault用户

提问于 2021-02-07 20:48:46

回答 1查看 151关注 0票数 0

您好，各位管理员，我正在寻求有关以下情况的高级指导：

首先是环境的上下文:内部的、所有的虚拟的(vmware)、仅用于开发的、在整个堆栈中优化的性能、可以接受的停机时间(一次几台服务器需要1-2天)、预算意识强、写入OLTP工作负载重、SAN (语法所有闪存SAS)与主机之间的10 DBAs链接、小团队--我们都不是正式的DBAs、所有数据库都有简单的恢复模型、san卷是ext4的，LUN上也有很厚的规定。

从我还是个管理员的时候起，备份和冗余就一直冲击着我的头脑。到目前为止，我一直在关注这个问题，因为预算有限，20个服务器( Linux上的SQL Server (Ubuntu，以避免windows许可费用)中有大量数据90 TBs )，大约有40个数据库。因此，我们使用RAID 0。这是因为我们有沉重的写工作负载，而且用例/应用程序/业务需要高吞吐量，即使对于开发，所有的驱动器都在支持列表语法中。

有许多情况导致当前的配置。配置是，单卷存储池( RAID 0中的4×4/8 2TBs)、单卷、单LUN、单个VMFS，如果4TB驱动器卷有2-6个VM (6到2tbs)，是8 to的两倍，密集的急切供应，SAN使用98%的可用容量，其他所有设备都使用100%。我知道这降低了容量规划的可见性，这在这里是如何处理的。因为我们使用RAID 0来节省成本和性能，所以我们将其限制在4个驱动器上，以便在驱动器出现故障时减少受影响的服务器。这也有助于避免服务器之间发生冲突，对vmware IO的使用有很低的要求。

为了对话起见，让我们说大幅增加预算($2,000+)是不可能的。应该知道，我们已经完全c级签署了停工的风险。

最后，我们必须有几个50TBs数据存储池，其中存储池配置为RAID 108x7.2K HDDs，而不是使用SSD的RAID 0，而且这种性能水平是不够的，因为对于HDDS可以生成的IOPS来说，工作量太大了。

这就引出了我的问题，考虑到这些限制，这是否一个很好的表现方式？其他人对类似的目标和限制做了什么？请记住，在驱动器故障的情况下，某些服务器一次可接受停机时间，因为这不是生产工作负载，而是在AWS和Azure。

我知道这个问题涉及很多领域，但我也知道很多DBA现在不得不熟悉这些领域，我真的在为那些有类似情况的人寻求建议。

谢谢

raid

vmware-esxi

storage-area-network

synology

database-performance

回答 1

Server Fault用户

回答已采纳

发布于 2021-02-07 22:52:40

在白天完成备份恢复测试。破坏存储卷以模拟RAID 0存储池故障，这将使测试系统瘫痪。从备份媒体复制，并完成还原。如果组织对恢复感到满意并容忍了这么多的停机时间，那么RAID 0方案就可以工作。(我怀疑他们是否能容忍几个小时的下滑，但可能是这样。)

恢复测试对任何存储都是有用的，但是如果在第一次驱动器故障时需要进行恢复，则特别重要。

在办公时间进行这样的恢复测试很重要。开车故障不要等到下班后。因此，这迫使用户了解恢复真正意味着多少停机时间。另外，您的系统管理员不应该必须为一个测试系统工作奇怪的时间，而这个测试系统被记录为不太重要。

关于性能，您的容量规划定义了IOPS预算。查看来自数据库、主机或存储数组级别的IOPS编号，并观察性能何时可以接受。

7200 RPM驱动器在小块随机负载下，每个驱动器可能得到70 IOPS，生。不是很多。将您的IOPS需求除以这个来近似于所需的纺锤数。对于固态也是如此，每个驱动器应该有数千IOPS。比较每个IOPS的价格以及每个容量的价格。

这仅仅涵盖了存储设计的可能性的开始。例如，具有SSD和纺锤体的混合数组是可能的。但是，这些存储在具有缓存层的存储中工作最好，或者像RAID 4这样明显的瓶颈。对于大多数RAID类型来说，统一存储更容易管理。

票数 2

页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://serverfault.com/questions/1052736

复制

相似问题

问RAID 0用于开发
EN

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问RAID 0用于开发EN

回答 1

Server Fault用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问RAID 0用于开发
EN