首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hadoop WordCount示例问题,我需要做一些性能调优吗?

Hadoop WordCount示例问题,我需要做一些性能调优吗?
EN

Stack Overflow用户
提问于 2011-08-05 07:48:27
回答 2查看 810关注 0票数 2

我是Hadoop的新手。

最近,我刚刚做了一个WordCount示例的实现。

但是当我在我的单个节点上运行这个程序时,只有两个输入文件,只有9个字,这样做花费了将近33秒!太疯狂了,这让我很困惑!

有人能告诉我这是否正常吗?

我怎样才能解决这个问题?记住,我只创建了两个输入文件,其中有9个字。

提交主机地址: 127.0.0.1

作业-ACL:允许所有用户

职务设置:成功

现状:成功

开始时间:05年8月5日14:27:22 CST 2011

结束时间:2005年8月5日14:27:53科技委2011

完成时间:30秒

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-08-05 09:51:49

Hadoop对于非常小的作业并不有效,因为JVM启动、进程初始化和其他工作需要更多的时间。不过,通过启用JVM重用,可以在一定程度上对其进行优化。

http://hadoop.apache.org/common/docs/r0.20.2/mapred_tutorial.html#Task+JVM+Reuse

另外,在Apache Hadoop中也有一些工作要做。

https://issues.apache.org/jira/browse/MAPREDUCE-1220

不确定将包含在哪个版本中,也不确定JIRA的状态如何。

票数 3
EN

Stack Overflow用户

发布于 2011-08-05 07:53:33

这并不稀奇。Hadoop对大型数据集生效。您所看到的可能是Hadoop的初始启动时间。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6953077

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档