首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >domain.com/index.html之类的urls来自何处,以及如何修复404

domain.com/index.html之类的urls来自何处,以及如何修复404
EN

Stack Overflow用户
提问于 2019-02-20 01:47:15
回答 1查看 39关注 0票数 0

因此,出于某种原因,爬虫会在现有URL和报告404的末尾使用"/index.html"获取URL。

示例:

代码语言:javascript
复制
domain.com/index.html 
domain.com/pricing/index.html 
domain.com/solutions/index.html 
domain.com/solutions/project-management/index.html

问题是,在我们的网站上,我们有例如"domain.com/pricing"。但我们没有真正的"domain.com/pricing/index.html"

我想知道:

  1. 是什么原因导致这些URL首先出现在搜索引擎上呢?
  2. 有没有快速修复方法将类似"domain.com/whatever/index.html"的内容重定向到"domain.com/whatever"

这件事已经困扰我一段时间了!

EN

回答 1

Stack Overflow用户

发布于 2019-02-20 02:08:59

在我看来,不允许Google索引页面的最佳选择是添加meta:

代码语言:javascript
复制
<meta name="robots" content="noindex">
<meta name="googlebot" content="noindex">

要重定向,必须通过cPanel完成

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54777614

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档