我有一个搜索引擎,它通过在倒排索引中看到搜索到的文本,搜索文本并编写相应的网页集,并抛出相应的网页。
现在我想再添加一个功能,那就是,它将根据颜色进行搜索。
例如,当我搜索"RED SHOES“时,它会显示所有处于倒排索引数据结构的红色鞋子。
我对算法的看法是一样的,
所以这就是我爬行的方法,当任何像“红鞋”一样的搜索出现的时候。它通过在红色索引中看到相应的红色颜色项。
这是我的算法构建阶段,所以我没有为上面的算法编写任何代码。一旦我得到正确的方法,然后我开始我的编码阶段。
所以请给我一个建议,
这是个好算法吗?或
是否需要优化或更改,如果需要,请与我分享/讨论更改。
提前谢谢。找你好意的回应。
发布于 2013-02-28 04:06:10
对于任何可伸缩的搜索引擎,几乎可以肯定,没有图像分析,您的生活会更好。相反,考虑使用例如<img>标记中属性的文本对图像进行索引。例如,如果图像的alt文本为"red shoes",则可以在该文本下索引图像。当您稍后搜索"red"时,图像将有机会被返回。
如果你是认真做这种图像分析,你可以使用一个库,如图像魔术,以计算一个颜色直方图。然后,您可以应用一个聚类模型,甚至只是一个决策树来注意某些范围内的大量颜色,并声明一组颜色标记(如"red"、"rouge"、"vermillion"等),然后将图像编入索引。
如果你觉得自己疯了,你可以在直方图上做余弦相似。这将允许您以查询的形式提交图像。不过,不知怎么的,我不认为你是这么想的。
https://stackoverflow.com/questions/15127195
复制相似问题