HDFS有两个节点名称节点和数据节点。并且YARN有一个资源管理器和一个节点管理器。我想知道这些实体是在一台机器上。就像namenode和资源管理器在一台机器上一样。在另一台机器上同时使用Datanode和nodemanager。根据我的理解,客户端请求namenode提供数据存储位置的信息,这类似于请求资源的资源管理器。datanode包含数据,这是wat nodemanager包含的数据,在该数据上执行map reduce作业。
如果我对HDFS的理解有误,请纠正我。谢谢
发布于 2020-07-26 23:31:06
名称节点、数据节点、ResourceManger和NodeManager都是运行在不同节点/机器上的服务。没有硬性规定这些服务需要在不同的计算机上运行或在同一台计算机上运行两台/三台的组合,这取决于管理员,他希望如何部署,您绝对可以让它们一起在相同的节点/计算机上运行。数据节点和NodeManager在相同的节点/机器上,而命名节点/资源管理器在不同的相同机器上,没有什么特别的。根据机器上可用的资源(内存/vCore),您可以将它们全部放在单独的机器上,也可以将它们中的任何一个放在一起,比如名称节点和数据节点放在一起,并将ResourceManager和NodeManager放在一起。
对于HDFS架构:https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html
对于YARN架构:https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html
Note.Namenode和Datanode是HDFS的一部分,HDFS是存储层,而ResourceManager和NodeManager是YARN的一部分,YARN是资源协商者。因此,HDFS和YARN虽然通常在一起工作,但在设计和体系结构上却是完全独立的
https://stackoverflow.com/questions/63056666
复制相似问题