我在impala中有一个关于数据局部性的问题,假设我有10个数据节点的集群(在每个数据节点上有impalad),如果我在impala SELECT * FROM big_table where dt='假设分区(dt=2017')下的文件在dn 1,3,5中,那么如果我要执行查询,协调器是只使用守护进程1,3,5进行数据定位,还是使用所有的守护进程,而其他守护进程将远程读取此数据
可以在任意一个集群节点上引导一个Hadoop应用程序,不相关地引导到节点类型上吗?应该只在其中一个节点上引导吗?是否将代码移动到接近数据的适当节点?是否用于移动代码?< code >G29</code>在每个已安装的Hadoop节点上,都应该显式地分配主节点,方法是将fs.default.name of core-site.xml设置为Namenode,将相反,它们在Hadoop启动时动态地加入集群,或者在守护进程停止时离开集群,对吗?如果Ha