我需要实现内容网站搜索基于sitecore。我知道如何为Lucene.Net设置爬虫,但这将是某种预先定义的模板搜索,我需要实现搜索的结果内容(最终的html),它的工作应该像接近谷歌搜索。在塞托雷可以做吗?
谢谢。
发布于 2014-01-11 15:22:54
如果您希望搜索是基于呈现的HTML (您真的确定这一点),则需要一些自定义魔术。在这种情况下需要爬行内容,因此如果发布的项是可访问的(有一个URL),您可以使用HTMLAgility框架获取HTML,去掉标记并将内容添加到您喜欢的任何(新)字段中的索引中.
https://stackoverflow.com/questions/19221277
复制相似问题