我特别感兴趣的是如何处理像Google搜索或Google Maps这样的商业服务的大量信息。我们都知道它们使用(或者至少“确实”使用了)一种Linux集群,但是它们到底是如何组织的呢?他们使用什么类型的硬件,什么文件系统,网络,最常见的问题是什么?
发布于 2010-08-11 20:33:23
答案取决于你想要做什么。Google创建了他们自己的分布式数据库,但他们也创建了自己的计算机场和许多其他东西。一旦你决定走同一条路,就没有简单的方法去做了,但你肯定需要数百万的基础设施和开发投资。Matthew在评论中提供了关于Google所做事情的资料链接。
但是,如果您目标是创建web应用程序,那么您可能不希望花费时间自己创建基础结构,而是使用市场上已有的东西。如果你想创建可以处理海量数据的应用程序,每小时为数百万客户服务,那么你绝对应该考虑像Amazon Elastic Computing cloud和Microsoft Azure这样的云基础设施。
优势在于,您可以以合理的价格获得具有已实施的数据库应用程序和即时可伸缩性的巨大计算场,并且没有与之相关的it成本。您可以立即将其从一台服务器扩展到数百台服务器,然后在需求高峰过后恢复到一台服务器。
以下是亚马逊弹性计算云的描述:http://aws.amazon.com/ec2/
下面是对其可伸缩数据库服务的描述:http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/
https://stackoverflow.com/questions/3010007
复制相似问题