是否有一种方法或最佳实践可以使用提取处理程序将多个文件(例如,2个pdf和1个doc)添加到一个solr-index-doc中?查询时的结果应该看起来像这样:
<result name="response">
<str name="id">123</str>
<doc>
<arr name="attr_content">
content of pdf-1
</arr>
</doc>
<doc>
<arr name="attr_content">
content of pdf-2
</arr>
</doc>
<doc>
<arr name="attr_content">
content of doc-1
</arr>
</doc>
</result>在我的java应用程序中,我将文件添加到Solr-Index中,就像只添加一个文件一样:
ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");
up.addFile(new File("c:\\document1.pdf"));
up.setParam("literal.id", solrId);
up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);
solr.request(up);发布于 2011-10-26 00:59:03
https://stackoverflow.com/questions/7892310
复制相似问题