首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >扩展Solr搜索:“火山”与“火山”匹配

扩展Solr搜索:“火山”与“火山”匹配
EN

Stack Overflow用户
提问于 2013-08-06 17:31:14
回答 2查看 170关注 0票数 0

我在我的rails应用程序上安装了websolr,运行在heroku上。我只是注意到,对“火山”的搜索并没有返回我所期望的所有结果。具体而言,它确实返回了一个既包括“火山”也包括“层叠火山”的结果。

我需要如何修改solr配置来解决这个问题?

这是我的schema.xml的相关部分

代码语言:javascript
复制
<fieldType name="text" class="solr.TextField" omitNorms="false">
  <analyzer>
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SnowballPorterFilterFactory" language="English" />
  </analyzer>
</fieldType>

加法:我认为这与此无关,只是以防万一:

我的Rails Photo.rb模型的设置如下:

代码语言:javascript
复制
  searchable do
    text :caption, :stored => true
    text :category do
      category.breadcrumb
    end

    integer :user_id
    integer :category_id
    string :caption
    string :rights
  end

标题和类别是我搜索的两个文本字段。标题是自由形式的文本,而类别是像“地球科学>火山”这样的文本字符串。

这是我在websolr中显示的同义词配置(我添加了最后一行):

代码语言:javascript
复制
#some test synonym mappings unlikely to appear in real input text
aaa => aaaa
bbb => bbbb1 bbbb2
ccc => cccc1,cccc2
a\=>a => b\=>b
a\,a => b\,b
fooaaa,baraaa,bazaaa

# Some synonym groups specific to this example
GB,gib,gigabyte,gigabytes
MB,mib,megabyte,megabytes
Television, Televisions, TV, TVs
#notice we use "gib" instead of "GiB" so any WordDelimiterFilter coming
#after us won't split it into two words.

# Synonym mappings can be used for spelling correction too
pixima => pixma

volcano => volcanic,stratovolcanoes
EN

回答 2

Stack Overflow用户

发布于 2013-08-07 13:46:57

我相信这是SnowballPorterFilterFactory的引入造成的。

将此包括在分析器列表中,导致Solr将堵住应用于您的条款。特别是,在本例中Solr执行波特词干

如果您不需要堵塞,您可以删除该分析器。

票数 0
EN

Stack Overflow用户

发布于 2013-08-08 07:12:10

如果没有针对带有词干的特定情况获得所需的结果,则可以添加一个solr.SynonymFilterFactory过滤器,如去descibed 这里

代码语言:javascript
复制
<fieldtype name="syn" class="solr.TextField">
  <analyzer>
      <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      <filter class="solr.SynonymFilterFactory" synonyms="syn.txt" ignoreCase="true" expand="false"/>
  </analyzer>
</fieldtype>

然后,您将能够维护同义词文件:

代码语言:javascript
复制
volcano => volcanic, stratovolcanoes
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18086737

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档