首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >HDFS复制-存储的数据

HDFS复制-存储的数据
EN

Stack Overflow用户
提问于 2012-03-15 02:53:27
回答 1查看 1.5K关注 0票数 2

我是hadoop的新手,我想更好地了解HDFS中复制的工作原理。

假设我有一个10节点系统(每个节点1 TB ),总容量为10 TB。如果我的复制因子为3,则每个文件有1个原始副本和3个副本。因此,从本质上讲,我的存储空间中只有25%是原始数据。因此,我的10 TB集群实际上只有2.5 TB的原始(未复制)数据。

请告诉我我的思路是否正确。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-03-15 03:13:42

你的想法有点不对劲。复制系数为3表示您的数据总共有3个拷贝。更具体地说,您的文件的每个数据块将有3个副本,因此如果您的文件由10个数据块组成,那么您的10个节点总共将有30个数据块,或者说每个节点大约3个数据块。

您认为10x1TB群集的容量小于10TB的想法是正确的-复制系数为3,实际上它的功能容量约为3.3TB,实际容量略小,因为执行任何处理、存放临时文件等都需要空间。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/9708298

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档