最近,我决定使用聚合物库(WebComponents)对我的网站进行编码。
基于app组件的应用程序/网站的常见结构是将该结构封装在类似应用程序的元素中,如下所示:
<my-app></my-app>并为属于应用程序的每个自定义元素创建一个文件。聚合物是非常有用的,也可以用来组织和程序的基本网页或网站。不过,我有一个奇迹。
因为用于微数据引用和指数化的所有信息都包含在应用程序主要元素的阴影中,所以任何爬虫都只会获取页面,只看到正文中的<my-app></my-app> (或者仅仅是我的想象)。然后
谷歌爬虫有能力读取多姆阴影吗?
换句话说,爬虫是否像真正的用户,等待页面变得稳定,等待所有Dom树被呈现,就像我们在chrome浏览器上打开developer-tool窗口时所能处理的那样?
这一点非常重要,因为所有的微数据都用于页面/应用程序的主要语义,从而使一个人的网站在任何搜索引擎中都能被很好地引用。
发布于 2018-01-26 17:48:49
如果使用finalize,您的意思是所有JS都被执行,那么答案是否定的,而不一定是这样。Google机器人有时只能首先考虑页面的内容,而不执行JS。稍后,他们可以回来等待JS的全面执行。
如果你的网站不是垃圾邮件,使用禁止的技术等,那么机器人肯定会分析你网页的JS版本,这只是时间问题。
https://stackoverflow.com/questions/38440086
复制相似问题