我读过Hadoop- -“权威指南”,我碰到了以下几条线:
规范化给MapReduce带来了问题,因为它使读取记录成为一种非本地操作,而MapReduce所做的核心假设之一是可以执行(高速)流读写。
有人能解释一下这些台词在外行人语言中到底意味着什么吗?
我知道什么是正常化。它如何使读取记录成为非本地操作?对于hadoop来说,非本地操作的含义是什么?
发布于 2014-09-04 06:15:40
在hadoop中,本地操作是指在存储需要处理的数据的同一物理位置执行代码。
当你标准化你的数据,你实际上是分裂它。如果这个“拆分”数据被分配到两个物理上不同的区域,那么您就突然有了非本地操作。
https://stackoverflow.com/questions/25658247
复制相似问题