首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大量文件的分布式存储

大量文件的分布式存储
EN

Stack Overflow用户
提问于 2013-09-20 13:19:01
回答 1查看 311关注 0票数 2

小集思广益。

我为分布式存储解决方案搜索最合适的解决方案。我寻找一个高效的键/值存储,平面命名空间,最小的延迟。

场景

我计划保存1Ko或更少的小blob记录。它们大多是生产/消耗的记录:

  • 1写
  • 1阅读,更多关于罕见的情况。
  • 删除,几个月后存档。

然而,一些记录可能增长到10 be,这是最大的,但必须是可能的。

数据必须在磁盘上序列化

重要

我的第一优先是一个存储空间,它可以在一个真正的文件列表中提供良好的响应时间,这个列表中可能有数亿个文件。

当然,使用这个数字,我不关心迭代我的文件(我寻找功能,但不关心性能,只关心调试或维护)。

当然,这种规模的解决方案,没有SPOF只会更好。

必须是Linux解决方案,不允许云(私有数据)。

我所发现的

我看了伏地魔,卡桑德拉和HBase。

  • 恐怕卡桑德拉和HBase对blob记录并不有效。
  • 伏地魔看上去还不成熟,我找不到支持的记录大小和文件数量的信息。

我还检查了Lustre和Ceph,但它们不是key/value商店。

CouchBase和MongoDB在持久性激活的情况下性能很差。

我正在运行一些测试,但还不能真正启动可靠的基准测试。如果有人有关于这个解决方案的一些信息,或者知道另一个产品设计这样的工作负载?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-09-24 05:59:36

您看过像英菲尼西哈泽尔卡斯特这样的内存数据网格吗?它们具有良好的可伸缩性和响应性,但是如果有一天您会考虑对这些条目进行任何处理,则存储10 on对象可能会是一个问题。但是,例如,Hazelcast允许在拥有目标条目的集群的同一个成员上执行任务,从而减少成员间数据流的数量。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18917846

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档