我找到了这篇关于在服务器端为爬行器生成html的文章http://docs.google.com/Doc?id=dcsq25m_04k4cmgfd。你们对使用这种技术根据用户代理提供不同的内容有何看法?
关于在gwt上做seo的最好方法,有什么参考文章或建议可以分享吗?我确实阅读了progwt2.0技术,但在我看来有点过头了。
发布于 2011-09-23 22:55:09
我们公司的网站和我们发布的所有内容都是基于GWT的,并且完全由google索引。我们使用来自AJAXCrawling的方法。这是迄今为止我见过的最好的方法。
发布于 2009-12-14 17:34:31
坦率地说,我们在开发joobili.com时也遇到了这个问题,这并不容易,但我认为我们现在的解决方案是好的。
我们不向搜索引擎提供不同的内容,因为这被称为伪装,而谷歌不喜欢这种做法。
对于每个页面,我们都有一个html版本(老实说,这不是什么大问题,你根本不必处理设计,只需在页面上放一些内容和链接即可)。
您可以使用标签来显示此内容。如果你在页面上以对象的形式提供初始内容,你也可以提高速度。为此,我们使用了一个稍微修改过的kiyaa框架对象序列化程序版本。
我们还使用了gwt2.0-s代码拆分机制,这使得主页的加载速度更快。
当然,您必须确保您为搜索引擎(没有javascript的浏览器)提供的内容与您提供给用户的内容相关。
Best - Istvan - inepex.com
发布于 2009-06-16 07:05:17
主要的问题是,搜索引擎不喜欢你使用不同的输出,当你爬行和浏览器“亲自”访问时,除非你在应用程序上的标签中提供了指向上述html生成的页面的链接。
此外,使用GWTTestcase呈现html的性能问题可能是灾难性的,因为它没有针对性能进行调整(而是为了测试和调试)事实上,爬虫在短时间内访问网站的次数往往比用户多,而且您可能会发现搜索引擎会耗尽您的CPU。
不幸的是,到目前为止,还没有任何令人满意的解决方案。
https://stackoverflow.com/questions/994502
复制相似问题