我有一个保存音乐作品的数据库,一个标题的例子可以是“我看到一个灵魂”。
就像现在一样,我正在使用一个配置了LengthFilterFactory的字段对音乐作品进行索引,以过滤出少于2个字符和超过255个字符的单词。当然,这会过滤掉"I See A Soul“中的"I”和"A“,因此生成的索引文档将保留标题"See Soul”。因此,这不会产生预期的结果,因为用户无法搜索“我看到一个灵魂”。所以,我要删除LengthFilterFactory。
然而,我很好奇:在什么情况下,去掉一定长度的单词是个好主意?
发布于 2013-10-21 16:06:03
关键是,您也可以将相同的过滤器应用于查询。因此,如果用户搜索“我看到一个灵魂”、“看到一个灵魂”或“你看到一个灵魂”,他仍然会找到相同的结果。
另一个想法是,如果你有一个要求,不允许用户搜索,直到他们输入至少3个字母(例如自动完成功能),你可能不想索引少于3个字母的单词,因为无论如何都不会搜索它们。
https://stackoverflow.com/questions/19488963
复制相似问题