首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Lucene/Solr -编制出版物/文本索引

Lucene/Solr -编制出版物/文本索引
EN

Stack Overflow用户
提问于 2015-10-21 13:19:40
回答 1查看 38关注 0票数 0

我希望能够用面搜索出版物。这些文档将被注释,所以我将把注释上传到solr实例。注释将包含字段,这些字段是文档中的术语。下面是一个示例:

代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<add>
    <doc>
        <field name="Title">High Glucose Increases the Expression of Inflammatory Cytokine Genes in
Macrophages Through H3K9 Methyltransferase Mechanism.</field>
        <field name="Cytokine">INTERFERON </field>
        <field name="Cytokine">CYTOKINE </field>
        <field name="Cytokine">CYTOKINE</field>
        <field name="Cytokine">MEC</field>
        <field name="Cytokine">EPA</field>
        <field name="Cytokine">DIA</field>
        <field name="Cytokine">FIC</field>
        <field name="Cytokine">CYTOKINES</field>
        <field name="Cytokine">INTERLEUKIN-6 </field>
        <field name="Cytokine">INTERLEUKIN</field>
        <field name="Cytokine">IL-12P40</field>
        <field name="Cytokine">IL-12</field>
        <field name="Cytokine">IL-1</field>
        <field name="Cytokine">P40</field>
        <field name="Cytokine">MACROPHAGE INFLAMMATORY PROTEIN-1</field>
        <field name="Cytokine">MACROPHAGE INFLAMMATORY PROTEIN</field>
    </doc>
</add>

这些术语都来自细胞因子本体论。

我希望能够将小面设置为细胞因子,然后选择该术语并找到包含所选术语的所有文档。

以下是问题所在:

  • 我希望能够存储该术语在文档中的位置(它可以显示在多个位置。以便稍后我可以突出显示)。所有这些位置都存储在注释中。
  • 我希望能够从facet中选择其中一个术语,还可以弹出包含同义词的文档,但不能将其上传为facet中的术语(或者将其区分为同义词--一些方式(类似子类别))。例如汽车和汽车
  • 我希望能够进行交叉搜索,例如找到包含MEC和EPA的文件。
  • 我有一个条件列表,我确实想索引,并希望通过搜索文档。这些术语都有我输入到synonyms.txt文件中的同义词。

另外,当一个术语在文档中多次出现时,注释有多个具有不同位置的术语实例,我应该如何处理这个问题?solr会自动处理复制,不会给我两次文件吗?

还有一件事:如何将整个发布上传到solr,并在预定义的术语列表上对其进行索引?

EN

回答 1

Stack Overflow用户

发布于 2015-10-21 18:33:48

我知道,你有同义词,一个搜索词应该被直接验证,也应该用同义词来验证,并返回结果。如果我拿到了就告诉我。

如果索引时拥有所有同义词,则可以将其索引为多值字段并在该字段上搜索。

Faceting用于搜索,其中的结果是分组的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/33260459

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档