首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hadoop:配置对象时出错

Hadoop:配置对象时出错
EN

Stack Overflow用户
提问于 2012-01-24 08:06:31
回答 4查看 16.4K关注 0票数 7

我正在尝试运行Terasort基准测试,我得到了以下异常:

代码语言:javascript
复制
java.lang.RuntimeException: Error in configuring object
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)
    at org.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)
    at org.apache.hadoop.util.ReflectionUtils.newInstance(ReflectionUtils.java:117)
    at org.apache.hadoop.mapred.MapTask$OldOutputCollector.<init>(MapTask.java:573)
    at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:435)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:371)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:259)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1059)
    at org.apache.hadoop.mapred.Child.main(Child.java:253)
Caused by: java.lang.reflect.InvocationTargetException
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:88)
    ... 10 more
Caused by: java.lang.IllegalArgumentException: can't read paritions file
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:213)
    ... 15 more
Caused by: java.io.FileNotFoundException: File _partition.lst does not exist.
    at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:371)
    at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:245)
    at org.apache.hadoop.fs.FileSystem.getLength(FileSystem.java:720)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1417)
    at org.apache.hadoop.io.SequenceFile$Reader.<init>(SequenceFile.java:1412)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.readPartitions(TeraSort.java:153)
    at org.apache.hadoop.examples.terasort.TeraSort$TotalOrderPartitioner.configure(TeraSort.java:210)
    ... 15 more

TeraGen命令运行良好,并且已经为TeraSort创建了输入文件。下面是我的输入目录的清单:

代码语言:javascript
复制
bin/hadoop fs -ls /user/hadoop/terasort-input/Warning: Maximum heap size rounded up to 1024 MB
Found 5 items
-rw-r--r--   1 sqatest supergroup           0 2012-01-23 14:13 /user/hadoop/terasort-input/_SUCCESS
drwxr-xr-x   - sqatest supergroup           0 2012-01-23 13:30 /user/hadoop/terasort-input/_logs
-rw-r--r--   1 sqatest supergroup         129 2012-01-23 15:49 /user/hadoop/terasort-input/_partition.lst
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00000
-rw-r--r--   1 sqatest supergroup 50000000000 2012-01-23 13:30 /user/hadoop/terasort-input/part-00001

下面是我运行terasort的命令:

代码语言:javascript
复制
bin/hadoop jar hadoop-examples-0.20.203.0.jar terasort -libjars hadoop-examples-0.20.203.0.jar /user/hadoop/terasort-input /user/hadoop/terasort-output

我确实在我的输入目录中看到了_partition.lst文件,我不明白为什么我要获取FileNotFoundException。

我遵循了http://www.michael-noll.com/blog/2011/04/09/benchmarking-and-stress-testing-an-hadoop-cluster-with-terasort-testdfsio-nnbench-mrbench/上提供的设置详细信息

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2012-02-16 14:03:55

出现问题是因为我在NFS上部署作业。我更改了hadoop.tmp.dir,使其指向本地文件系统(/tmp),这个问题很快就消失了。

票数 0
EN

Stack Overflow用户

发布于 2012-02-08 15:21:13

我让它按如下方式工作:

我在本地模式下从hadoop基目录hadoop-1.0.0运行,下面有一个输入子目录,我得到了与您相同的错误。

我编辑了失败的java文件,让它记录路径而不是文件名,重新构建它("ant binary"),然后重新运行它。它正在从我运行的目录中查找文件。我不知道它是在hadoop基本目录中查找还是在执行目录中查找。

...so我在我运行terasort的目录中创建了一个符号链接,指向输入目录中的实际文件。

这是一个便宜的黑客,但它是有效的。

代码语言:javascript
复制
- Tim.
票数 0
EN

Stack Overflow用户

发布于 2013-02-12 10:59:00

您是否设置为在伪分布式模式(或真正的集群)下运行?除非您配置Hadoop,否则它将在本地作业运行器模式下运行(作为单个进程中的库)- Terasort不能在LocalJobRunner模式下工作。在要检查的输出中查找单词LocalJobRunner。

下面是设置HDFS、SSH和rsync的链接:http://hadoop.apache.org/docs/r1.1.1/single_node_setup.html#PseudoDistributed

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8980412

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档