站点设置
我有一个完全客户端,一个页面的网页应用,是动态更新和路由的客户端。我重定向任何#!请求到无头服务器,该服务器使用执行的javascript呈现请求,并将最终的html返回给bot。该网站的负责人还包括:
<meta name="fragment" content="!">抓取谷歌的作品
使用Fetch作为Google工具,在Fetch状态页面中,我可以看到我用来更新og:title、og: jQuery和og:description的jQuery已经执行,默认值也被替换了。一切看起来都很好,如果我在URL上移动鼠标,屏幕截图是正确的。
但是,使用Google按钮,无论更新到哪些值og:title、og:image和og:description标记,共享弹出总是使用默认值/初始值。
尝试使用
每次站点内容更新、重路由和og元内容更新后,我都会调用它。
gapi.plusone.render("plusone-div");我假设,如果这种方法适用于Googlebot,那么它也应该适用于+1按钮。Googlebot和+1用来检索站点元数据的东西之间有什么区别吗?
编辑:传递一个包含#的url!结果出现在“找不到的地方”
gapi.plusone.render("plusone-div", {"href" : 'http://www.site.com/#!city/Paris');发布于 2013-10-17 04:43:37
当+1按钮呈现时,Google爬虫不会呈现代码片段,而是当用户单击+1按钮(或共享按钮)时。您应该尝试的是确定您的服务器在此用户启动和由Google爬虫异步加载期间发送给Googlebot的内容。
您可以使用以下cURL命令来模拟这一点:
curl -A "Mozilla/5.0 (Windows NT 6.1; rv:6.0) Gecko/20110814 Firefox/6.0 Google (+https://developers.google.com/+/web/snippet/)" http://myurl.com/path/to/page通过向命令中添加-o testoutput.html,可以将该命令输出到文件中。
这将让你了解谷歌爬虫在遇到你的页面时看到了什么。结构化数据测试工具也可以给出提示。
您可能会看到的是,除非您在静态文件中或在服务器端进行代码段准备,否则您很可能不会得到您想要的片段。
如果您能够提供真正的URL进行测试,我可能可以提供更具体的反馈。
发布于 2014-01-28 00:34:10
Google+使用_escaped_fragment_查询参数获取页面,但不使用等号。
因此,它将获取http://www.site.com/?_escaped_fragment而不是https://www.site.com?_escaped_fragment_=
谷歌搜索爬虫仍然使用等号的片段,这只是谷歌加爬虫。
https://stackoverflow.com/questions/19418055
复制相似问题