我目前正在研究狮身人面像搜索引擎,我对wordforms和libstemmer有一些问题。这是我的配置:
wordforms = /etc/sphinxsearch/wordforms.txt
morphology = libstemmer_french, libstemmer_english
http://sphinxsearch.com/blog/2015/09/09/sphinx-2-2-10-release/当libstemmer被激活时,wordforms文件中的一些关联根本不起作用。例如: girafe >长颈鹿,science > sciense,aztec > azteque,louie > louis,当我禁用libstemmer选项时,一切正常。
因此,我不明白如何同时使用libstemmer和wordform,因为libstemmer应该在 wordforms之后被称为,而不是之前的。
发布于 2016-01-22 13:36:59
因为libstemmer应该是在wordforms之后调用,而不是以前。
它被应用在后面。但词形实现了“词法例外”,即如果一个词被字形改变,那么词法就不适用了。(只有在词法没有应用的情况下)
唯一的希望就是这个小甜头。
从版本2.1.1-beta开始,.,如果一行以倾斜("~")开头,则单词形式将在词法之后应用,而不是在前面。
..。因此,可以将词干词放入单词形式中,然后得到这两组处理。
https://stackoverflow.com/questions/34941965
复制相似问题