文章/答案/技术大牛

发布

社区首页 >问答首页 >大量文件的分布式存储

问大量文件的分布式存储
EN

Stack Overflow用户

提问于 2013-09-20 13:19:01

回答 1查看 311关注 0票数 2

小集思广益。

我为分布式存储解决方案搜索最合适的解决方案。我寻找一个高效的键/值存储，平面命名空间，最小的延迟。

场景

我计划保存1Ko或更少的小blob记录。它们大多是生产/消耗的记录：

1写
1阅读，更多关于罕见的情况。
删除，几个月后存档。

然而，一些记录可能增长到10 be，这是最大的，但必须是可能的。

数据必须在磁盘上序列化。

重要

我的第一优先是一个存储空间，它可以在一个真正的文件列表中提供良好的响应时间，这个列表中可能有数亿个文件。

当然，使用这个数字，我不关心迭代我的文件(我寻找功能，但不关心性能，只关心调试或维护)。

当然，这种规模的解决方案，没有SPOF只会更好。

必须是Linux解决方案，不允许云(私有数据)。

我所发现的

我看了伏地魔，卡桑德拉和HBase。

恐怕卡桑德拉和HBase对blob记录并不有效。
伏地魔看上去还不成熟，我找不到支持的记录大小和文件数量的信息。

我还检查了Lustre和Ceph，但它们不是key/value商店。

CouchBase和MongoDB在持久性激活的情况下性能很差。

我正在运行一些测试，但还不能真正启动可靠的基准测试。如果有人有关于这个解决方案的一些信息，或者知道另一个产品设计这样的工作负载？

storage

distributed

key-value-store

filesystems

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-09-24 05:59:36

您看过像英菲尼西或哈泽尔卡斯特这样的内存数据网格吗？它们具有良好的可伸缩性和响应性，但是如果有一天您会考虑对这些条目进行任何处理，则存储10 on对象可能会是一个问题。但是，例如，Hazelcast允许在拥有目标条目的集群的同一个成员上执行任务，从而减少成员间数据流的数量。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/18917846

复制

相似问题

问大量文件的分布式存储
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大量文件的分布式存储EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大量文件的分布式存储
EN