首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Solr:索引fb2文件

Solr:索引fb2文件
EN

Stack Overflow用户
提问于 2016-09-15 11:09:22
回答 1查看 122关注 0票数 2

我想使用Solr为一些图书馆建立索引,这些图书馆以fb2格式表示书籍。实际上,fb2就是具有类似xsd format的xml。但是,post.jar忽略了*.fb2文件,我不明白如何将fb2文件中的值映射到索引字段,例如:

代码语言:javascript
复制
<book-title>some book</book-title>

索引中的...to“图书标题”字段。我应该创建一个插件,还是其他什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-09-15 19:56:55

您应该看看Solr Data Import Handler (DIH)。

https://cwiki.apache.org/confluence/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

在Solr examples文件夹中有一个RSS导入示例。如果您查看rss-data-config.xml文件,您将看到他们如何使用XPathEntityProcessor从XML映射到Solr字段,例如:

以下是更多信息:http://www.andornot.com/blog/post/Sample-Solr-DataImportHandler-for-XML-Files.aspx

我过去也编写过Tika解析器来处理特定的文件格式。

https://lucidworks.com/blog/2010/06/18/extending-apache-tika-capabilities/

为了获得更大的灵活性,您可以只使用自己喜欢的编程语言读取文件,然后使用API将数据发送到Solr。我们不得不为最近的一个应用程序这样做,因为DIH不够灵活,无法实现我们想要实现的目标。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39502550

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档