当我们为Coveo在Sitecore中执行索引重建时,Coveo爬虫如何在内部工作并将项发布到Cloud?
发布于 2020-07-11 15:48:13
爬虫是一个Coveo模块,它扫描项以索引并提取其内容。如果项是安全的,则爬虫还提取其权限并将其保存为项元数据。
Coveo.SearchProvider.config和默认情况下,对/sitecore/content和/sitecore/media library/Files下的所有内容和媒体项进行索引时,Coveo默认的爬虫配置是定义的。您可以在Coveo.SearchProvider.Custom.config中修补这些配置,方法是更改索引的爬行根,以防止在特定索引中索引不需要的项和/或添加新的爬行根。
Coveo for Sitecore利用Sitecore索引更新策略来自动索引Sitecore项。在master数据库中创建、删除和修改的项将在这些事件发生时进行索引。在web数据库中,在发布操作(OnPublishEndAsync)结束时对已发布的项进行索引。
在搜索索引上配置的爬虫的帮助下,search遍历一组项,并使用搜索提供程序框架将它们传递给搜索索引。在索引期间,每个Sitecore项被转换为Coveo项,并提取其文本。
重建是抓取一组文档并将它们推入索引。在处理结束时,搜索索引将只包含已爬行的文档。由于Cloud是一项在线服务,因此必须上载这些项目才能进行索引。
https://stackoverflow.com/questions/62451480
复制相似问题