首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >分布式网络B+trees

分布式网络B+trees
EN

Stack Overflow用户
提问于 2011-12-14 03:01:03
回答 1查看 1.9K关注 0票数 2

我想构建一个跨越多节点的B+tree

计算机网络( Linux PC的内部子网)

弹性海量存储。距离扫描很重要。

这是否基本上就是

分布式数据库系统?(卡桑德拉,HBase)

有没有关于分布式B+Trees的研究?

我在网上看到了这篇文章

http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf

但是跳过BTrees只是删除故障节点(因此会有数据丢失)

我对具有内置冗余的B+Trees特别感兴趣

(即如果主机发生故障并且它主存的所有节点都离线,

我希望另一个复制的主机成为主节点

服务器并替换故障主机)

我不想使用DB实例的集合

(1个节点,1个DB)作为分片不是一个好的选择

对于大规模扩展的存储系统(跨商品

带有自由/开源软件操作系统的x86、x64硬件)。

我是在重新发明轮子吗?

我应该只使用Cassandra还是HBase?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-12-17 10:12:13

Cassandra支持范围查询。

当你打开机器时,谷歌的Big Table会自动将新机器添加到集群中。它非常灵活,很容易添加更多的机器。不幸的是,它的速度有一个缺点:查询非常受限。您可以执行一些范围查询。有关列表和更多详细信息,请参阅本文:http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

一个很好的例子是如何在大表中存储数据:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

一个很好的堆栈溢出帖子:storing massive ordered time series data in bigtable derivatives

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8494668

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档