在我的数据集中,"ITS“这个词意味着”信息技术服务“。然而,当我在solr中搜索"ITS“时,我得到了像"it”、"it's“和"its”(形容词)这样的结果。没有与“信息技术服务”相关的结果。为此,我如何更改Solr?
下面列出了我的文件架构。我实际上使用了两个字段。一个有词干,另一个没有词干。但它仍然不起作用。
<fieldType name="text" class="solr.TextField"
positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true" words="stopwords.txt"/>
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1"
catenateWords="1" catenateNumbers="1" catenateAll="0"
splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPorterFilterFactory"
protected="protwords.txt"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
</fieldType>
<!-- for no stemming -->
<fieldType name="text_no_stemming" class="solr.TextField"
positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true" words="stopwords.txt"/>
<filter class="solr.WordDelimiterFilterFactory"
generateWordParts="1" generateNumberParts="1"
catenateWords="1" catenateNumbers="1" catenateAll="0"
splitOnCaseChange="1"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
</fieldType>发布于 2012-10-16 16:19:25
你不能让Solr知道它是“信息技术服务”的同义词。您首先需要这样做,检查SynonymFilter
https://stackoverflow.com/questions/12905124
复制相似问题