我需要为实时引擎实现一个分布式存储系统。存储系统的一些基本要求包括:
1)将数据分区到不同的分区
2)每个分区都有用于容错和数据持久性的副本
3)动态伸缩节点
这似乎是许多大数据项目的常见功能。所以我想知道有没有什么开源框架可以让这件事变得更容易?我做了一些调查,但没有发现任何有用的东西。如有任何建议,欢迎光临。
发布于 2019-03-23 19:19:26
这可能是显而易见的,但HDFS是大多数大数据项目的幕后使用,并且作为Hadoop的一部分,它是开源的。
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
https://stackoverflow.com/questions/55244503
复制相似问题