首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在其他分布式文件系统(如MapR和hdfs )上存储Cassandra数据是否可行?

在其他分布式文件系统(如MapR和hdfs )上存储Cassandra数据是否可行?
EN

Stack Overflow用户
提问于 2020-04-27 21:36:13
回答 1查看 265关注 0票数 1

我只想知道将apache的数据存储到任何其他分布式文件系统中的影响。

例如,假设我有5节点的Hadoop集群和3的复制因子。

同样,对于cassandra,我有5个集群节点,所有键空间的复制因子为3。所有数据将存储在具有相同安装路径的hdfs位置。

例如,节点-0 Cassandra数据目录-"/ data /user/cassandra-0/“

而Cassandra记录目录-“/data/user/cassandra-0/log/

有了这样的架构,我需要对以下几点提出意见-

数据和提交日志目录中建议的

  1. 应该是不同的,在这种情况下是不可能的。默认配置下,cassandra提交日志大小为8192 is。因此,根据我的理解,如果我有一个1TB的磁盘,如果磁盘满了,或者任何磁盘级别的错误将停止整个cassandra,clusters??
  2. Second问题与底层存储机制有关。通过为hdfs指定复制因子3和为cassandra指定3复制因子,两个级别的数据分发,那么相同的数据(马厩)是否将存储在9个位置?严重的记忆丧失,请建议

EN

回答 1

Stack Overflow用户

发布于 2020-04-28 08:39:47

Cassandra不支持在非本地文件系统(如HDFS等)上开箱即用的数据存储。理论上,您可以黑客攻击源代码来支持这一点,但这是没有意义的-- Cassandra处理复制本身,并且不需要有额外的文件系统层。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61468867

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档