我有一个SEO问题单页应用程序。
我们正在开发一个向用户显示数字数据表的SPA (尚未公开)。数据量大,数字聚合成本高,必须在高并发用户的情况下保持一致的状态。所有这些都会对服务器造成很大的压力。
因为这是一个AJAX应用程序,所以对于爬虫,我们按照推荐的做法(如?_escaped_fragment_=...)提供HTML内容。
该应用程序是针对人类用户将生成的使用模式进行优化的,但是爬虫索引整个站点将导致峰值。
应用程序的体系结构允许我们在纵向和横向上进行扩展,但这意味着在硬件上花费更多的钱。一种更便宜的解决方案是向搜索引擎提供包含随机数据的HTML内容,而不是生成昂贵的实数。
所有内容都将与用户在浏览器中看到的内容相同,但都带有随机数字。无论如何,搜索引擎都不会理解这些数字,所以没有必要加载服务器来构建它们。
正如我说的,我的问题是SEO相关的。我们不想做SEO优化或者欺骗搜索引擎,我们只是想降低服务器上的负载。但我们担心这会影响应用程序的排名?所以会吗?
发布于 2014-10-17 15:07:35
在我看来,你不应该为用户和搜索引擎提供不同的内容;它被称为隐形,你很可能知道,这是一个糟糕的搜索引擎优化实践。而且,即使你不想操纵搜索引擎的结果,我认为谷歌机器人也不会有任何区别,正如你所知,它们只是机器人。
当你说搜索引擎不关心表中的假数据时,你就错了。搜索引擎机器人需要与用户相同的数据。实际上,他们需要相同的数据来允许用户在SERPs中再次找到结果。
事实上,我认为你找到了解决办法,即使这是昂贵的。除了优化您的架构站点之外,我不知道您如何能够优化站点的性能(从而优化SEO)。
发布于 2014-10-17 15:12:20
由于这是一个AJAX应用程序,所以将数据与转义片段分别写入页面。用户将生成两个AJAX请求:
GET /fragment?id=12345,它将包含屏幕的文本和HTML,并为数据设置占位符。GET /data?id=12345是要写入屏幕的实际数据(也许数据是JSON格式的)。您可以拥有一个类似于:
Disallow: /data这样用户就可以得到数据,但是搜索引擎机器人却无法访问它。搜索引擎机器人仍然可以使用普通的/fragment爬行方法从?_escaped_fragment_= URL获取文本和其他信息。
https://webmasters.stackexchange.com/questions/71124
复制相似问题