如果我想支持所有语言的全文搜索,我应该使用哪种词干处理语言。据我所知,索引需要使用特定的词干语言创建,以支持使用该语言进行搜索,但这对我来说是不可能的,因为我的搜索程序可能包含不同的语言
-- Manoj
发布于 2014-08-14 02:44:06
词干提取并不是适用于所有语言的概念。例如,它不适用于中文。但对于印欧语系的语言( Snowball网站上的大多数词干分析器都是针对印欧语系的),一个共同的单词结构模式确实出现了。假设单词是从左到右书写的,则单词的词干或词根在左侧,并且可以在右侧添加零个或多个后缀。如果根被这个过程修改了,它通常在它的右端。并且还可以在左边添加前缀。
@资源: Snowball网站
https://stackoverflow.com/questions/10383548
复制相似问题