SharePoint 2010 search中的爬网程序影响规则和爬网规则有何不同?
发布于 2011-02-13 06:27:43
爬网程序影响规则定义爬网期间SharePoint服务帮助搜索服务从网站请求文档的速率。该速率可以定义为请求的同时文档的数量,也可以定义为请求之间的延迟。在没有crawler影响规则的情况下,请求的文档数从5到16,具体取决于硬件资源。
您可以使用爬网程序影响规则修改对站点进行爬网时放置在这些站点上的负载。
搜索规则使您能够在要从特定路径搜索内容时设置企业搜索索引引擎的行为。通过使用这些规则,您可以:
例如,在内容源指向http://www.microsoft.com/等URL路径,但您希望防止"downloads“子目录http://www.microsoft.com/downloads/中的内容被爬行的情况下,您可以为该URL设置一条规则,并将行为设置为排除该子目录中的内容。
使用前面的方案,如果下载目录包含一个应该包含在爬网中的名为"content“的目录,您将为以下网址创建一条爬网规则,并将行为设置为包含"content”子目录http://www.microsoft.com/downloads/content。
https://stackoverflow.com/questions/4980867
复制相似问题