我已经设置了Hadoop2.6的单个节点集群,但我需要将zookeeper与其集成在一起。我是一个初学者,以前没有大数据工具的经验。如何设置动物园管理员来协调hadoop集群,以及如何在hdfs上使用hbase?它们是如何结合起来形成生态系统的?
发布于 2015-08-05 16:16:04
对于独立模式,只需遵循本HBase指南中提供的步骤:http://hbase.apache.org/book.html#quickstart
HBase有一个独立的模式,使初学者更容易开始工作。在独立模式下,hbase、hdfs和zk在单个JVM进程中运行。
发布于 2016-08-21 13:52:53
这取决于您想要构建的系统类型。正如您所说,Hadoop生态系统是我的三个主要组件: HBase、HDFS和动物园管理员。虽然它们可以彼此独立安装,但有时不需要全部安装它们,这取决于您想要安装的集群类型。
由于您使用的是单个节点集群,所以可以选择两种HBase运行模式:独立模式和伪分布式模式。在独立模式下,不需要安装HDFS或。HBase将以透明的方式做任何事情。如果要使用伪分布式模式,可以对本地文件系统或HDFS运行HBase。如果要使用HDFS,就必须安装Hadoop。关于动物园管理员,同样,HBase也将自己完成这项工作(您只需要通过配置文件告诉他这一点)。
如果您想在伪分布式模式下使用HDFS,下载Hadoop将得到HDFS和MapReduce。如果不想执行MapReduce作业,只需忽略它的工具即可。
如果您想了解更多,我认为本指南解释得很好:https://hbase.apache.org/book.html (检查HBase运行模式)。
https://stackoverflow.com/questions/31830810
复制相似问题