在学习hadoop和spark的过程中,我遇到了“分布式数据处理”和“分布式计算”。
你可否让我知道两者是相同的,还是指不同的概念?
发布于 2020-05-06 21:43:07
虽然理论上可能有细微差别,但在实践中,这两个术语所指的概念是相同的。
根据维基百科:
计算是使用计算机管理、处理和交流信息的任何活动。
以及:
数据处理通常是“收集和操作数据项以产生有意义的信息”(.)。它可以被认为是信息处理的一个子集。
根据这些定义,数据处理可以看作是计算的一个子集。
然而,这两个术语在历史上一直交替使用,直到最近的过去。因为计算的根源是拉丁文,意思是计算,因为早期计算机的使用大多是数值计算。因此,在早期,进行计算或处理(大部分是数字)数据实际上是相同的活动。
https://softwareengineering.stackexchange.com/questions/409798
相似问题