首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >RAID 0用于开发

RAID 0用于开发
EN

Server Fault用户
提问于 2021-02-07 20:48:46
回答 1查看 151关注 0票数 0

您好,各位管理员,我正在寻求有关以下情况的高级指导:

首先是环境的上下文:内部的、所有的虚拟的(vmware)、仅用于开发的、在整个堆栈中优化的性能、可以接受的停机时间(一次几台服务器需要1-2天)、预算意识强、写入OLTP工作负载重、SAN (语法所有闪存SAS)与主机之间的10 DBAs链接、小团队--我们都不是正式的DBAs、所有数据库都有简单的恢复模型、san卷是ext4的,LUN上也有很厚的规定。

从我还是个管理员的时候起,备份和冗余就一直冲击着我的头脑。到目前为止,我一直在关注这个问题,因为预算有限,20个服务器( Linux上的SQL Server (Ubuntu,以避免windows许可费用)中有大量数据90 TBs ),大约有40个数据库。因此,我们使用RAID 0。这是因为我们有沉重的写工作负载,而且用例/应用程序/业务需要高吞吐量,即使对于开发,所有的驱动器都在支持列表语法中。

有许多情况导致当前的配置。配置是,单卷存储池( RAID 0中的4×4/8 2TBs)、单卷、单LUN、单个VMFS,如果4TB驱动器卷有2-6个VM (6到2tbs),是8 to的两倍,密集的急切供应,SAN使用98%的可用容量,其他所有设备都使用100%。我知道这降低了容量规划的可见性,这在这里是如何处理的。因为我们使用RAID 0来节省成本和性能,所以我们将其限制在4个驱动器上,以便在驱动器出现故障时减少受影响的服务器。这也有助于避免服务器之间发生冲突,对vmware IO的使用有很低的要求。

为了对话起见,让我们说大幅增加预算($2,000+)是不可能的。应该知道,我们已经完全c级签署了停工的风险。

最后,我们必须有几个50TBs数据存储池,其中存储池配置为RAID 108x7.2K HDDs,而不是使用SSD的RAID 0,而且这种性能水平是不够的,因为对于HDDS可以生成的IOPS来说,工作量太大了。

这就引出了我的问题,考虑到这些限制,这是否一个很好的表现方式?其他人对类似的目标和限制做了什么?请记住,在驱动器故障的情况下,某些服务器一次可接受停机时间,因为这不是生产工作负载,而是在AWS和Azure。

我知道这个问题涉及很多领域,但我也知道很多DBA现在不得不熟悉这些领域,我真的在为那些有类似情况的人寻求建议。

谢谢

EN

回答 1

Server Fault用户

回答已采纳

发布于 2021-02-07 22:52:40

在白天完成备份恢复测试。破坏存储卷以模拟RAID 0存储池故障,这将使测试系统瘫痪。从备份媒体复制,并完成还原。如果组织对恢复感到满意并容忍了这么多的停机时间,那么RAID 0方案就可以工作。(我怀疑他们是否能容忍几个小时的下滑,但可能是这样。)

恢复测试对任何存储都是有用的,但是如果在第一次驱动器故障时需要进行恢复,则特别重要。

在办公时间进行这样的恢复测试很重要。开车故障不要等到下班后。因此,这迫使用户了解恢复真正意味着多少停机时间。另外,您的系统管理员不应该必须为一个测试系统工作奇怪的时间,而这个测试系统被记录为不太重要。

关于性能,您的容量规划定义了IOPS预算。查看来自数据库、主机或存储数组级别的IOPS编号,并观察性能何时可以接受。

7200 RPM驱动器在小块随机负载下,每个驱动器可能得到70 IOPS,生。不是很多。将您的IOPS需求除以这个来近似于所需的纺锤数。对于固态也是如此,每个驱动器应该有数千IOPS。比较每个IOPS的价格以及每个容量的价格。

这仅仅涵盖了存储设计的可能性的开始。例如,具有SSD和纺锤体的混合数组是可能的。但是,这些存储在具有缓存层的存储中工作最好,或者像RAID 4这样明显的瓶颈。对于大多数RAID类型来说,统一存储更容易管理。

票数 2
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/1052736

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档