问如何在hadoop中创建nutch作业
EN

Stack Overflow用户

提问于 2014-04-16 16:00:43

回答 1查看 780关注 0票数 2

hadoop jar apache-nutch-1.6.job org.apache.nutch.crawl.Crawl firstSite/urls -dir urls -depth 1 -topN 5

Exception in thread "main" java.io.IOException: Error opening job jar: apache-nutch-1.6.job
        at org.apache.hadoop.util.RunJar.main(RunJar.java:90)
Caused by: java.io.FileNotFoundException: apache-nutch-1.6.job (No such file or directory)
        at java.util.zip.ZipFile.open(Native Method)
        at java.util.zip.ZipFile.<init>(ZipFile.java:215)
        at java.util.zip.ZipFile.<init>(ZipFile.java:145)
        at java.util.jar.JarFile.<init>(JarFile.java:153)
        at java.util.jar.JarFile.<init>(JarFile.java:90)
        at org.apache.hadoop.util.RunJar.main(RunJar.java:88)

nutch

hadoop

回答 1

Stack Overflow用户

发布于 2014-10-31 10:41:04

直接的答案是apache-nutch-1.6作业丢失或不在当前目录中。

Apache Nutch .job文件(例如apache- nutch -1.9.job)是在编译nutch(通过'ant')时在runtime/deploy/中创建的。请注意，创建此文件需要apache-nutch的源代码发行版，而不是二进制版本。

.job文件实际上是一个JAR文件。它比apache-nutch-1.9.jar大得多，因为它包含所有依赖项(以及conf/中的文件)，因此它包含运行Hadoop作业所需的所有内容。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/23103403

复制

相似问题

问如何在hadoop中创建nutch作业
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在hadoop中创建nutch作业EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在hadoop中创建nutch作业
EN