我在我的rails应用程序上安装了websolr,运行在heroku上。我只是注意到,对“火山”的搜索并没有返回我所期望的所有结果。具体而言,它确实返回了一个既包括“火山”也包括“层叠火山”的结果。
我需要如何修改solr配置来解决这个问题?
这是我的schema.xml的相关部分
<fieldType name="text" class="solr.TextField" omitNorms="false">
<analyzer>
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="English" />
</analyzer>
</fieldType>加法:我认为这与此无关,只是以防万一:
我的Rails Photo.rb模型的设置如下:
searchable do
text :caption, :stored => true
text :category do
category.breadcrumb
end
integer :user_id
integer :category_id
string :caption
string :rights
end标题和类别是我搜索的两个文本字段。标题是自由形式的文本,而类别是像“地球科学>火山”这样的文本字符串。
这是我在websolr中显示的同义词配置(我添加了最后一行):
#some test synonym mappings unlikely to appear in real input text
aaa => aaaa
bbb => bbbb1 bbbb2
ccc => cccc1,cccc2
a\=>a => b\=>b
a\,a => b\,b
fooaaa,baraaa,bazaaa
# Some synonym groups specific to this example
GB,gib,gigabyte,gigabytes
MB,mib,megabyte,megabytes
Television, Televisions, TV, TVs
#notice we use "gib" instead of "GiB" so any WordDelimiterFilter coming
#after us won't split it into two words.
# Synonym mappings can be used for spelling correction too
pixima => pixma
volcano => volcanic,stratovolcanoes发布于 2013-08-07 13:46:57
我相信这是SnowballPorterFilterFactory的引入造成的。
将此包括在分析器列表中,导致Solr将堵住应用于您的条款。特别是,在本例中Solr执行波特词干
如果您不需要堵塞,您可以删除该分析器。
发布于 2013-08-08 07:12:10
如果没有针对带有词干的特定情况获得所需的结果,则可以添加一个solr.SynonymFilterFactory过滤器,如去descibed 这里:
<fieldtype name="syn" class="solr.TextField">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="syn.txt" ignoreCase="true" expand="false"/>
</analyzer>
</fieldtype>然后,您将能够维护同义词文件:
volcano => volcanic, stratovolcanoeshttps://stackoverflow.com/questions/18086737
复制相似问题