首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么尽管设置了solr.server.url参数,但nutch索引为错误的solr集合呢?

为什么尽管设置了solr.server.url参数,但nutch索引为错误的solr集合呢?
EN

Stack Overflow用户
提问于 2019-03-23 06:51:59
回答 1查看 151关注 0票数 1

将nutch 1.15与solr8.0集成,但当我使用以下命令时

代码语言:javascript
复制
nutch/bin/crawl -i -D solr.server.url=http://192.168.199.109:8983/solr/csdn -s ./csdn-seed/ ./data/csdn 1

为了索引从nutch到solr的爬行数据,它抛出了hadoop.log中的异常

代码语言:javascript
复制
2019-03-23 02:03:07,491 WARN  mapred.LocalJobRunner - job_local1877827743_0001
java.lang.Exception: org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException: Error from server at http://localhost:8983/solr/nutch: Expected mime type application/octet-stream but got text/html. <html>
<head>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8"/>
<title>Error 404 Not Found</title>
</head>
<body><h2>HTTP ERROR 404</h2>
<p>Problem accessing /solr/nutch/update. Reason:
<pre>    Not Found</pre></p>
</body>
</html>

    at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:529)
Caused by: org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException: Error from server at http://localhost:8983/solr/nutch: Expected mime type application/octet-stream but got text/html. <html>
<head>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8"/>
<title>Error 404 Not Found</title>
</head>
<body><h2>HTTP ERROR 404</h2>
<p>Problem accessing /solr/nutch/update. Reason:
<pre>    Not Found</pre></p>
</body>
</html>

但实际上,我将solr.server.url设置为/solr/csdn,不是吗?但是为什么它告诉我它是索引到/solr/nutch

EN

回答 1

Stack Overflow用户

发布于 2019-03-24 13:55:04

配置索引器插件的方式随着Nutch 1.15而改变:所有索引插件现在都配置在一个XML文件中(conf/index-writers.xml),不再可能通过Nutch属性设置或覆盖配置参数。请参见https://wiki.apache.org/nutch/IndexWriters如何配置Solr服务器URL。为了允许同一类型的多个索引器(例如,多个Solr实例),这种破坏更改是必要的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55311356

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档