我有一个复合的c1网站。我喜欢使用Microsoft Search Server功能。我已经安装了所有的软件,但当我搜索时,我会得到每一页的结果,因为导航菜单在每一页上都有索引。当我使用导航菜单上的class="noindex“选项时,菜单中使用的链接后面没有爬虫。
谁能告诉我如何才能排除内容,但确保爬虫仍然遵循内容中使用的链接?
发布于 2011-11-30 15:14:11
考虑有网站地图页面与您的网站的导航结构,并在某个地方的链接到这个页面,可以通过crawler...then,而不是所有的页面在结果中搜索时,从“导航标题”的一些关键字,你将只有网站地图页面。
发布于 2011-11-29 21:14:20
这基本上是Microsoft Search Server的一个问题,但复合C1的C1包试图解决这个问题。引用自http://docs.composite.net/Composite.Search.MicrosoftSearchServer:
从索引中排除页面内容的
确保在C1网站的Web.config中指定了RemapperHttpModule。如果不是,请执行以下操作:
<httpModules>和<modules> (适用于IIS7.0或更高版本)元素下添加以下配置:现在,要从Microsoft Search Server索引中排除页面的一部分:
<div class="noindex">确保crawler找到您的页面的
导航元素的排除将发生在复合C1端,因此这样做将移除Search Server crawlers跟踪这些链接的能力。您可以通过确保您的网站上有一个站点地图来解决此问题,并让Search Server索引指向该站点地图页面的URL。
https://stackoverflow.com/questions/8311188
复制相似问题