文章/答案/技术大牛

发布

社区首页 >问答首页 >网站管理员工具爬虫403错误

问网站管理员工具爬虫403错误
EN

Stack Overflow用户

提问于 2011-12-18 21:06:46

回答 2查看 1.2K关注 0票数 1

Google网站管理员工具报告了网站服务器上一些文件夹的403个错误，例如：

http://www.philaletheians.co.uk/Study%20notes/

这个文件夹没有被禁止，所以我不明白为什么Googles会有403个错误？

为什么Google Crawler试图浏览实际的文件夹，而不是直接转到该文件夹中的文件？这跟robots.txt有关吗？

http-status-code-403

googlebot

google-search-console

回答 2

Stack Overflow用户

发布于 2012-10-03 18:51:40

如果有人请求该url，请确保存在任何实际位置或文档。我浏览了你的网站，但找不到指向http://www.philaletheians.co.uk/Study%20notes/的链接似乎所有的学习笔记都在这个" study %20notes“directory.So中这个链接无论如何都不会起作用。因此，检查google网站管理员工具的链接，找出这个断开的链接所在的位置，并修复它。

票数 2

Stack Overflow用户

发布于 2011-12-18 21:14:19

您是否在web服务器中正确设置了默认文档？在apache中，这是在DirectoryIndex设置(缺省为index.html)中提供的。此外，通常情况下，最好去掉空格等。从您的可遍历目录名称(您看到的学习和笔记之间的%20是一个url编码的空格字符)，以便保持您的url对您的访问者和搜索引擎机器人干净。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/8551911

复制

相似问题

问网站管理员工具爬虫403错误
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问网站管理员工具爬虫403错误EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问网站管理员工具爬虫403错误
EN