首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hadoop排序示例在“not SequenceFile”中失败。如何设置SequenceFile

Hadoop排序示例在“not SequenceFile”中失败。如何设置SequenceFile
EN

Stack Overflow用户
提问于 2013-04-19 08:32:25
回答 3查看 7.4K关注 0票数 0

我正在尝试运行bin/hadoop示例-1.0.4.jar排序输入输出

但是得到一个错误"java.io.IOException: hdfs://SequenceFile:9000/usr/ubuntu/input/file1 1而不是SequenceFile“

如果我运行bin/hadoop示例-1.0.4.jar字计数输入输出,它就工作了。

所以我不知道该怎么处理

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2013-04-19 08:44:57

这里的错误信息是完全正确的;sort示例期待一个序列文件 --一个二进制键和值的平面文件作为输入,这类文件通常是作为MapReduce作业的输出生成的。

但是,wordcount示例并不期望序列文件(特别是作为输入),仅仅是一个文本文件,其中的键是偏移量(行号)到文件中,值是行内容。

由于您拥有的输入文件本身不是序列文件,因此sort无法使用它们运行。

票数 1
EN

Stack Overflow用户

发布于 2014-11-04 07:27:45

@Jork,如果您观察到了hadoop-示例-1.0.4.jar中给出的示例排序,您可以通过命令行争用来更改输入和输出格式,或者可以将程序中的SequenceFileInputFormat更改为文本类型。hadoop

票数 0
EN

Stack Overflow用户

发布于 2016-11-17 18:01:54

我也有过同样的问题。在这里,https://wiki.apache.org/hadoop/Sort说:“输入和输出必须是序列文件。”您应该将输入文件转换为hadoop序列文件,我希望有一种更简单的方法。我发现这个教程很有帮助,祝你好运!https://examples.javacodegeeks.com/enterprise-java/apache-hadoop/hadoop-sequence-file-example/

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16100487

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档