我正在建设一个关于文化活动的新闻网站。
大多数已发表的文章都是关于事件(戏剧、音乐、艺术等)的,是从新闻机构、画廊等通过电子邮件发布的新闻稿中摘录的。
这一事实导致许多网站得到了所谓的新闻稿,因此谷歌可能会将其中一些网站标记为包含重复内容。
由于我的网站是最新的,它正在受到惩罚(隐藏在一些搜索结果),因为它被认为是一个内容复制的来源。
是否有任何方法(除了明显的不使用新闻稿,并让编辑改变它们),以避免被视为内容重复的来源?
发布于 2014-06-24 23:35:35
您是否将自己的内容添加到包含这些联合新闻稿的页面中?如果你在页面上的新闻稿中添加了你自己的一些内容,那么就好像你在引用它一样,有些人认为这有时可以解决问题--但与原始源相比,你确实需要在页面中添加更多自己的内容,并可能添加一个链接来赞扬它。
然而,这仍然是不理想的,也不能保证你的网站不会因为重复的内容而受到影响,我会尽量避免使用辛迪加内容,或者阻止页面被视为重复的内容。
你也可以这样做:
您可以在有问题的页面上使用跨域规范标记。在该页面的源代码中定义了一个规范标记,引用新闻稿的原始源:
<link rel="canonical" href="http://www.example.com/original-source-of-press-release" />这向Google表明,您知道页面包含重复的内容,因此在索引期间不要计算内容。然而,这将意味着,随着时间的推移,您的网站上的网页将从搜索结果中删除。
第二个选项是不对页面进行索引,这样Google就不再对页面进行索引,也不会将其计算为重复的内容。对此最好的方法是添加以下机器人元标签:
<META NAME="ROBOTS" CONTENT="NOINDEX, FOLLOW">这意味着Google仍然可以自由地抓取页面,但不会再将其编入索引,这意味着它将从搜索结果中删除。
https://webmasters.stackexchange.com/questions/65245
复制相似问题