我正在做一个项目,有很多零售商独立上传他们的产品信息,换句话说,完全相同的产品可能有不同的名称。例如,新的ipad,或者ipad,或者伟大的ipad等等。
我想向用户展示一个直观的界面,这样当他搜索ipad或ipad时,他就可以得到一台ipad和所有价格并驾齐驱的ipad。或者可能有两个搜索结果,第一个是旧ipad和不同零售商的所有价格,另一个是ipad 2的搜索结果,另一个是价格相邻的搜索结果。
具体例子:数据库包含:新的ipad 1,ipad 1,伟大的ipad 1,新的ipad 2,ipad 2,伟大的ipad 2,当用户搜索ipad时,他得到:
这主要是一个特定的搜索问题吗?或者机器学习,自动标记?
有没有人知道在Rails3中已经实现了这样的东西?
谢谢
发布于 2011-06-20 06:59:35
这是重复删除问题。地图目录都在处理。对于这一问题,有许多不同的成功程度的解决方案。最简单的方法是识别同义词和无用词(伟大,有趣)等,并使用这些信息进行匹配。一些不清楚的案件,你应该发送给人类审查。
例如“新苹果Ipad”与“伟大ipad”=删除无用的word=> "Apple“与"ipad”=等于by子字符串/to ambiguous=>相等
https://stackoverflow.com/questions/6405950
复制相似问题