我想构建一个跨越多节点的B+tree
计算机网络( Linux PC的内部子网)
弹性海量存储。距离扫描很重要。
这是否基本上就是
分布式数据库系统?(卡桑德拉,HBase)
有没有关于分布式B+Trees的研究?
我在网上看到了这篇文章
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
但是跳过BTrees只是删除故障节点(因此会有数据丢失)
我对具有内置冗余的B+Trees特别感兴趣
(即如果主机发生故障并且它主存的所有节点都离线,
我希望另一个复制的主机成为主节点
服务器并替换故障主机)
我不想使用DB实例的集合
(1个节点,1个DB)作为分片不是一个好的选择
对于大规模扩展的存储系统(跨商品
带有自由/开源软件操作系统的x86、x64硬件)。
我是在重新发明轮子吗?
我应该只使用Cassandra还是HBase?
发布于 2011-12-17 10:12:13
Cassandra支持范围查询。
当你打开机器时,谷歌的Big Table会自动将新机器添加到集群中。它非常灵活,很容易添加更多的机器。不幸的是,它的速度有一个缺点:查询非常受限。您可以执行一些范围查询。有关列表和更多详细信息,请参阅本文:http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html
一个很好的例子是如何在大表中存储数据:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable
一个很好的堆栈溢出帖子:storing massive ordered time series data in bigtable derivatives
https://stackoverflow.com/questions/8494668
复制相似问题