因为我的问题有些混乱,所以让它变得简单:
。
但据我所知,在典型数据中心和云之间无法找到任何形式的官方存储网络差异,所有云提供商都在使用与典型数据中心不同的DAS。
即使是DAS也比SAN或NAS有许多缺点,我想了解为什么云使用DAS来存储或应用程序。
任何资源或描述将不胜感激,以使我清楚。
编辑:大卫·伯恩斯坦和埃里克·路德维森(Cisco)在阅读论文“大规模云建设的网络挑战和由此产生的方法”时提到,
奇怪的是,我们没有看到主要提供商使用NAS或SAN的云。典型的云架构使用DAS,而DAS不是数据中心存储方法的典型。
但是这里有一个冲突:在我看来,并且在本文后面也说过,Clouds应该使用SAN或NAS,因为当VM移动到另一个服务器但仍然需要从原始服务器访问存储时,DAS是不合适的。
影响云选择DAS、NAS或SAN的其他原因是什么?大型云提供商使用什么样的存储?为什么?
发布于 2010-03-01 09:13:26
。
影响云选择DAS的其他原因是什么?
其中"DAS“指直接附加存储,即SATA或SAS硬盘驱动器。
云供应商都使用DAS,因为它在价格/性能方面提供了数量级的改进。这是水平缩放的一个案例。
简而言之,SATA硬盘驱动器和SATA控制器是便宜的商品。它们是大众市场的产品,价格很低.通过使用廉价的SATA驱动器构建大量廉价个人电脑,谷歌、亚马逊和其他公司以极低的价格获得了巨大的产能。然后,他们在顶部添加自己的软件层。他们的软件为性能和可靠性、监视、硬件故障后的再平衡复制等进行多服务器复制。
你可以把MogileFS看作是谷歌、亚马逊和其他人用来存储的软件的更简单的代表。当然,这是一个不同的实现,但它与大型系统有许多相同的设计目标和解决方案。如果您愿意,这里是学习更多关于GoogleFS的跳转点。
在后面的文章中,Clouds应该使用SAN或NAS,因为当VM移动到另一个服务器时,DAS是不合适的
SAN没有被使用的原因有两个。
1)价格。SAN的规模很大,非常昂贵。虽然它们可能是技术上“最佳”的解决方案,但由于成本原因,它们通常不用于非常大规模的安装。
2) CAP定理埃里克·布鲁尔的CAP定理表明,在很大范围内,在保持可接受的可靠性、容错性和性能的同时,不能保持较强的一致性。SAN是一种在硬件上实现强一致性的尝试。这可能对5.000服务器安装很好,但从未被证明适用于Google的250.000+服务器。
结果:到目前为止,云计算供应商已经选择将维护服务器状态的复杂性推给应用程序开发人员。当前的云产品并不为每个虚拟机提供一致的状态。应用服务器(虚拟机)可能崩溃,它们的本地数据在任何时候都会丢失。
然后,每个供应商都有自己的持久存储实现,您应该将其用于重要数据。亚马逊的产品就是很好的例子:MySQL、SimpleDB和简单存储服务。这些产品本身反映了CAP定理-- MySQL实例具有很强的一致性,但可伸缩性有限。SimpleDB和S3的规模惊人,但最终只是一致的。
发布于 2010-03-01 07:20:48
如果您使用DAS,那么可用性就是您的问题。
如果他们使用DAS,那么可用性就是他们的问题。如果它们很好的话,它们将使用几个抽象层来确保它们的问题不会成为您的问题。问题不在于他们选择如何在数据中心内挂载磁盘,而是他们在SLA中所保证的可用性是否足以满足您的需要。哦,还有房间里真正的大象,如果他们倒闭了,你会怎么做(也许对一些供应商来说不太可能,但你还是应该考虑一下),如果你在本地使用这些数据,并且你的网络连接不可用,你会做什么?后者比他们直接选择DAS导致中断的可能性要大得多。
发布于 2010-03-01 05:39:01
虽然我不知道DAS对SAN/NAS的答案.在寻找存储解决方案时,有很多事情要考虑。
数据量?如果我们考虑的是Gb,好吧,有备份的NAS可以完成任务。如果有大量的数据,价格就会迅速上涨。
我认为价格是主要因素..。如果你有SAN,你需要:
不过,你根本没有多余的东西。如果您可以访问数据中心,则情况可能有所不同。
另一件需要考虑的事情是可访问性。你在存档吗?如果这种可访问性不是一个问题,那么每天/一周/一个月将几次存档到存储解决方案中。
另一方面,如果您有需要不断访问的数据,您很快就会发现带宽、硬件限制(例如I/O)的瓶颈。但是另一方面,如果你的数据传输量很大,那么在线存储解决方案很有可能会花费你很多钱。
ROI (投资回报)是所有在线存储解决方案供应商所做的广告,当然,根据使用情况,它们往往是正确的。
祝好运。
https://serverfault.com/questions/117745
复制相似问题