我们将IBM v7用于基于电子商务的需求之一,其中嵌入了Apache solr以实现基于搜索的实现。
根据新的要求,将有一个网站的多语言支持,除法国版本的网站可以支持英语,法语等(en_FR,fr_FR等)。为了使用此接口配置solr,使用单个solr核心的最佳索引策略应该是什么?
我得到了一些想法: 1)在schema.xml中为多种语言使用多个字段,2)为不同的语言使用不同的solr核心。
但这些方法似乎不是最适合当前要求的方法,因为电子商务网站将有18种语言支持。为每种语言使用不同的字段将是非常复杂的,而且使用不同的solr代码也不是一个好的方法,因为我们需要在所有solr核心中应用配置更改,如果它根据任何要求发生的话。
是否有其他方法,或者有什么方法可以将localeId与索引数据相关联,并处理与检测到的语言相关的搜索结果?
任何关于这个主题的帮助都将受到高度的感谢。
感谢并致以问候
Jitendriya短划线
发布于 2014-08-12 13:58:27
这篇文章已经被原始帖子和其他人回复了--只需将其总结为答案:
推荐的解决方案是为每个语言环境/语言创建一个索引核心。如果目录或内容(如产品名称、描述、关键字)不同,并且企业倾向于为每个地区单独管理,则这一点尤其重要。这为Solr执行特定于该语言环境的词干和标记化提供了额外的好处。
我参与过的解决方案中,这种方法比在同一核心中为每个地区/语言维护多个字段或文档更可取。我使用过的大多数索引核心数都是6。
还必须记住,添加索引核心将需要更新支持流程(产品信息管理系统更新到目录、加载到工作区管理、阶段传播到重新索引到缓存失效)。
https://stackoverflow.com/questions/16057654
复制相似问题