我在SOLR中使用KStem过滤器工厂(KStemFF)。我意识到KStemFF并不是百分之百准确。
例如,它不会将“卡片”一词阻止为“卡片”。
“声卡”和“声卡”返回不同的结果。
是否有一种只使用KStemFF就能使其正常工作的方法?我意识到,在这种情况下,使用其他词干器,如波特-干涉仪可能会有所帮助,但我真的不想在这个项目中使用多个词干器。
发布于 2016-09-02 07:33:32
KStem在词干方面不如PorterStem强,因此可以跳过根据它所拥有的规则转换某些复数。在做出选择之前,您可能需要根据性能和结果比较几个词干器。没有单一的干细胞仪会给你100%的准确性和期望的结果,它必须是最适合的基础上,你的结果。
https://stackoverflow.com/questions/39276374
复制相似问题