首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >mahout seq目录无法读取输入文件。

mahout seq目录无法读取输入文件。
EN

Stack Overflow用户
提问于 2014-03-31 15:17:45
回答 1查看 687关注 0票数 0

我用seqdirectory运行Mahout,但是它失败了,并且说输入文件不存在。确实,该文件退出。

代码语言:javascript
复制
$ ls train-data/ -l
-rwxrwxrwx. 1 hadoop hadoop 5761396717 Feb 25 09:28 enwiki-20100904-pages-articles1.xml



$ mahout seqdirectory -i train-data/enwiki-20100904-pages-articles1.xml -o train-data
Running on hadoop, using /home/hadoop/hadoop-1.2.1/bin/hadoop and HADOOP_CONF_DIR=
MAHOUT-JOB: /home/hadoop/mahout-distribution-0.9/examples/target/mahout-examples-0.9-job.jar
14/03/31 19:45:05 INFO common.AbstractJob: Command line arguments: {--charset=[UTF-8], --chunkSize=[64], --endPhase=[2147483647], --fileFilterClass=[org.apache.mahout.text.PrefixAdditionFilter], --input=[train-data/enwiki-20100904-pages-articles1.xml], --keyPrefix=[], --method=[mapreduce], --output=[train-data], --startPhase=[0], --tempDir=[temp]}
Exception in thread "main" java.io.FileNotFoundException: File does not exist: train-data/enwiki-20100904-pages-articles1.xml
    at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:558)
    at org.apache.mahout.text.SequenceFilesFromDirectory.runMapReduce(SequenceFilesFromDirectory.java)
    at org.apache.mahout.text.SequenceFilesFromDirectory.run(SequenceFilesFromDirectory.java)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:79)
    at org.apache.mahout.text.SequenceFilesFromDirectory.main(SequenceFilesFromDirectory.java)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:622)
    at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:68)
    at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:139)
    at org.apache.mahout.driver.MahoutDriver.main(MahoutDriver.java)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:622)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:160)

有什么问题吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-31 15:56:54

您所引用的FileSystem是LocalFileSystem,但操作需要HDFS中的文件。因此,要么移动HDFS中的文件,要么设置MAHOUT_LOCAL变量。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22765468

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档