通常，当您开始开发一个图形应用程序时，您使用的是一台机器。在这个模型中，整个图都在一台机器上。如果图形很小(就数据大小而言)且事务负载较低(而不是大量的读/写)，那么当您进入生产阶段时，只需添加复制以实现高可用性。对于非分布式复制，数据将被完全复制到其他机器上，如果任何一台计算机发生故障，则其他机器仍可用于服务请求。同样，请注意，在这种情况下，您的数据不是分区/分发的，而是复制的。

接下来，随着图形的大小(超出单个机器的内存和HD空间)，您需要开始考虑分发。通过分发，您可以将图形划分到多机器集群上，并(为了确保高可用性)确保您有一些数据冗余(例如复制因子3)。

从单一服务器到分布式集群：http://thinkaurelius.com/2013/03/30/titan-server-from-a-single-server-to-a-highly-available-cluster/

目前，在土卫六中有两种划分数据的方法：

随机划分：顶点及其共位置的入射边缘分布在簇中.也就是说，顶点及其入射边形成一个“数据束”，并在机器上一起存在。随机分区确保集群得到适当的平衡，因此没有一台机器维护所有数据。一个简单的分配策略，通常是有效的。
用户定向分区：将顶点(及其事件边缘)分配给分区(此分区最终表示一台机器--尽管由于复制和多台机器上存在相同的数据而不是完全正确)。用户导向分区对于理解其域的拓扑结构的应用程序非常有用。例如，你可能知道不同大学的人之间没有什么比同一所大学的人之间有什么不同的边缘。因此，智能分区将基于大学。这确保了适当的顶点与顶点的协同定位，减少了多台机器，希望解决遍历问题.缺点是要确保集群不太不平衡(一个分区上的所有数据)。

说到底，整个故事都是关于同一地点的。你能确保相互检索的数据在物理空间上是接近的吗？

http://thinkaurelius.com/2013/07/22/scalable-graph-computing-der-gekrummte-graph/

最后，请注意，泰坦允许使用Faunus (http://faunus.thinkaurelius.com)并行读取(和写入)。因此，如果您有一个OLAP问题，需要扫描整个图，那么土卫六的共位置模型作为一个顶点是方便的，它的边缘是一个顺序读取从磁盘。再说一遍，这个故事仍然是一样的--按照时间上的共同检索，在太空中同处一处。

http://thinkaurelius.com/2012/11/11/faunus-provides-big-graph-data-analytics/

票数 8

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/20267047

复制

相似问题

问GraphDB查询与切分
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问GraphDB查询与切分EN