我正在阅读谷歌搜索引擎优化入门指南,它在第11页上说,你应该为用户准备一个网站,用XML编写一个搜索引擎。
我的网站是关于车辆的,而且车辆不是一个单独的文件夹。它会用GET和PHP动态加载--如果它“不存在”,Google可以爬行吗?
页面在?GET变量(如home.com/seevehicles?2009-camar )下,所以我做错了吗,还是谷歌也能爬行呢?
发布于 2013-08-18 18:58:58
动态内容是“动态”的,只有服务器端,客户端总是得到普通的HTML (换句话说,当它到达客户端时,一切都是静态的)。对于浏览器(或爬虫)来说,不管文档是动态的还是静态的,都是一样的:只需要解释一堆标记。
如果一个普通的访问者能够看到一个链接(或者一个超链接,如果你喜欢这个名字),这意味着他的浏览器已经找到了一个<a>标记,并将它解释为一个链接。如果浏览器能够做到这一点,那么爬虫也能做到这一点。因此,一个爬虫有一个URL,它会跟随它,并再次完成它的工作:索引它,并跟随下一个链接。它不会神奇地枚举服务器文件并逐个点击它们,它只是下面的链接。
发布于 2013-08-18 17:41:48
只需使用硬编码链接到主页的超链接即可。工作完成了。它能爬行任何HREF。
一旦您有了这些链接,构建一个sitemap.xml并在谷歌网站管理员工具中链接到它。
https://webmasters.stackexchange.com/questions/52019
复制相似问题