云数据仓库最近非常流行,我想知道它们的架构方式是否存在内在的矛盾:
Terradata、Greenplum等需要“无共享”架构才能很好地执行(根据供应商的文档),但是云的本质是大多数事情都是共享的。
当您在任何供应商的云中拆分VM时,您总是要使用共享存储(这就是虚拟化的本质)。
这肯定打开了存储数组和/或SAN争用的可能性?有谁能帮我理解:
发布于 2016-04-05 16:21:45
任何供应商如何在不造成配置瓶颈的情况下可靠地确保存储吞吐量(这对于DW性能至关重要)?
雇佣真正聪明的人来设计他们的后端系统。
当每个云供应商都使用虚拟化并因此使用共享存储时,我们为什么还要谈论“共享什么”呢?
什么都没分享。引用伊尼戈·蒙托亚的话:

当应用于分布式系统时,任何共享通常并不意味着它们具有对底层硬件的独占访问权。相反,shared指的是分布式系统的成员不需要访问相同的共享resource...shared存储。
为了给出一个具体的例子,在最近的一个VMware vCenter集群中,需要使用共享存储卷才能使用他们的实时迁移"VMotion“技术。每个ESXi成员主机都可以访问相同的后端存储,其中虚拟机数据实际上是存储的。这不是一个共享的nothing系统,因为主机必须共享一些东西。这种情况下的存储。
快速转发到当前的vCenter/ESXi发行版。现在,成员ESXi主机不再需要访问相同的共享存储卷。它们可以在主机之间直接迁移VM,包括传输VM备份数据(vmdk/vmx文件等)。从一个主人到另一个主人。这是一个没有共享的系统。
回到您关于云供应商、共享资源和性能保证的问题:仅仅因为资源是共享的,并不意味着无法设置控制来确保一定级别的性能。例如,在AWS中,可以根据其应用所需的特定IOP提供EBS卷。当您这样做时,AWS将保证您指定的IOPs设置在任何时候都可以满足。我在AWS中广泛使用这种类型的配置,并且可以保证它们在满足客户所需的IOP设置方面做得很好。
VMware (我认为Hyper-V)也有类似的技术,可以限制虚拟机的存储、网络和CPU的使用,并对其进行优先排序,这样它们就可以以可预测的方式运行,而不会对彼此产生不利影响。
https://serverfault.com/questions/768325
复制相似问题