我熟悉hadoop组件,如hive、hbase、hdfs等,但我对Apache Kudu非常陌生。
到目前为止,从我的研究中,我了解到kudu只不过是像拼花地板一样的柱状存储。而且它比Hbase更快。
但是我仍然找不到任何有效的文档来安装kudu。甚至我都在想,我是否真的需要为hadoop(EMR或Dataproc)中的kudu或其内置安装任何单独的包。
请帮帮忙,我怎样才能在kudu上开始动手呢?
发布于 2020-06-05 03:36:12
Kudu不是一种文件格式,而是一种不同的存储引擎。将其视为HDFS (或S3)的并行/替代文件系统。是的,它确实需要安装主服务器和Tablet服务器,请参阅Apache网站上的Architecture Overview。
由于它是一个开放源码的Apache项目,安装说明也可以在Apache网站上找到:https://kudu.apache.org/docs/installation.html。
https://stackoverflow.com/questions/62200657
复制相似问题