正如标题所示,我已经成功地配置了我的GSA来抓取我的PDF文件。它们显示在列表页面上,链接到它们,这样URL就可以被抓取并添加到特定的集合中(在这个帖子中称为“My”)。
爬行成功,我可以在GSA“My”集合的GSA爬行诊断中看到以下内容:
爬行诊断
File/Directory | Crawl Status
http://mydomain.com/Listings/MyPdfs.aspx | Crawled: New Document
http://mydomain.com/mypdfs/cat1/issue5.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat2/issue4.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat3/issue2.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat4/issue3.pdf | Crawled: New Document
http://mydomain.com/mypdfs/cat5/issue1.pdf | Crawled: New Document单个文件的爬行诊断
有关此页的详细信息()
available
修改:在此页面上链接到爬行页面的
但是,当使用GSA测试中心在相同的“My”集合上搜索时,PDF文件将不会返回。我确保在Test中使用适当的前端选择,以及正确的集合(“My”),然后使用文档中的关键字。我也尝试过使用文档的文件名,但仍然没有结果。我总是得到:
您的搜索-- TestKeyword --没有匹配任何文档。
没有发现包含"TestKeyword“的页面。
(显然,使用实际关键字)
有什么想法吗?
注意:使用GSA5.0。
发布于 2012-07-20 13:58:35
这是我们GSA设备上的一次腐败。在某个日期之后创建的任何新集合似乎都会被爬行,但无法搜索。以前工作过的现有集合可以继续更新,但新的集合不能更新。
用新的硬件取代GSA设备是迄今为止唯一有效的解决方案。
https://stackoverflow.com/questions/8718920
复制相似问题