首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >删除产品变体in之间的空格会减少solr5中的索引大小吗?

删除产品变体in之间的空格会减少solr5中的索引大小吗?
EN

Stack Overflow用户
提问于 2015-12-30 15:12:37
回答 1查看 43关注 0票数 0

我一直在把一些产品规格保存到Solr 5中。大多数产品都包含使用破折号或点的唯一变体ids,如:Samesung TV 54 : AD-oi-230Sony TV 24 : 1.849.32s.s

但有时,我遇到一些使用空格而不是破折号的变体I,如Samsung 54 : OPD 1 judSony 32 : s1 90 b33 9 337

由于这些if没有多大意义,如果我删除了这些空格(Samsung 54 : OPD1judSony 32 : s190b339337),它是缩小了还是缩小了索引大小?

这是我的字段,它存储模型名。我已经启用了WordDelimiterFilterFactory

代码语言:javascript
复制
  <fieldType name="text" class="solr.TextField" positionIncrementGap="100">
    <analyzer>
      <tokenizer class="solr.WhitespaceTokenizerFactory"/>
      <filter class="solr.WordDelimiterFilterFactory" preserveOriginal="0" generateNumberParts="1" splitOnCaseChange="0" catenateWords="1" splitOnNumerics="1" stemEnglishPossessive="0" generateWordParts="1" catenateAll="0" catenateNumbers="0"/>
      <filter class="solr.LowerCaseFilterFactory"/>
      <filter class="solr.LengthFilterFactory" min="2" max="20"/>
    </analyzer>
  </fieldType>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-04 08:08:16

索引大小在这里不是问题。特别是,因为无论您对分析器做什么,您仍然拥有原始的存储值。

但是,您所描述的(移除空格)对于值的规范化和确保搜索匹配ID是否包含空格或破折号是有意义的。所以,这是一个更好的理由来看看这个。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34532087

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档