一般来说,Google不想对包含重复内容的页面进行排名。
实际上,Google声明说:
“ Google努力索引和显示具有独特信息的页面”。
所以,如果您的网站上,没有独特的信息,都是些重复的信息,这会影响您的搜索引擎排名。
具体来说,包含大量重复内容的网站,主要遇到的3个主要问题:
很少的自然流量: 这很简单:Google不愿为从其他页面复制过来的内容建立索引。
(包括从您自己网站上的页面)
例如,假设您的网站上有三个页面,它们的内容相似。
Google不确定哪个页面是“原始”页面。因此,这三页都将很难被排名。
罚款(极少出现): Google表示:重复的内容可能会导致罚款或完全取消对网站的索引。
但是,这种情况很少见。只有当一个网站故意从其他网站抓取或复制内容,才可能出现这种情况。
如果您的网站有一些重复的页面,这种情况下,您可能无需担心“重复内容惩罚”。
被索引页面更少: 这对于页面很多的网站(例如电子商务网站)尤其重要。
有时Google不仅会降低重复内容的排名。甚至会拒绝索引它。
因此,如果您的网站页面没有被建立索引,很可能是抓取配额被重复内容浪费了。
最佳实践
注意不同的URL,相同的内容
这是最普遍的内容重复问题。
例如,假设您有一个电子商务网站。
您有一个销售T恤的产品页面。
如果设置正确,不同的尺寸、不同的颜色的T恤应该使用同一个URL。
但是,有时候您会发现:我们为不同型号的产品,创建了新的URL,这就导致了很多内容重复的页面。
另一个例子:
如果您的网站有搜索功能,这些搜索结果页面也能被索引。这很容易导致数千个页面添加到您的网站。所有的这些都包含重复内容。
检查被索引的页面
检查重复内容的一种最简单的方法是:查看网站被Google索引的页面数量。
方法,在Google搜索栏中输入:site:example.com
或在Google Search Console中,检查被索引页面。
无论使用哪种方式,这个数字都应该与您手动创建的页面数量一致。
例如,Backlinko有160个页面被建立索引:
这是我们手动创建的页面数量。
如果这个数字是16000或160000,我们就知道很多页面被自动添加了。这些页面可能包含了大量重复的内容。
确保您的网站正确重定向
有时候,相同的页面有多个URL。
虽然这种情况很少发生,但是我已经碰到了好多次。
当您网站的“ WWW”版本未重新定向到“非WWW”版本时,就会出现此问题。
(反之亦然)
如果您将站点切换到HTTPS…,但未重定向HTTP站点,也会发生这种情况。
简而言之:您网站的所有不同版本URL,都应该指向同一位置。
使用301重定向
301重定向是解决网站上重复内容问题的最简单方法。
(除了完全删除页面外)
因此,如果您在网站上发现了一堆重复的内容页面,请将它们重定向到原始页面。
一旦Googlebot开始爬取您的网站,它只会爬取原始内容。
(可以帮助这个原始页面获得排名)
注意相似的内容
重复的内容,并不意味着从其它地方完全复制内容。
实际上,Google将重复内容定义为:
因此,即使您的内容和现有的内容(严格地说)有差异,您仍可能遇到重复内容问题。
对于大多数网站而言,这不是问题。大多数站点都有几十个页面。他们可以为每个页面编写独特的内容。
但是在某些情况下,可能会出现“相似”重复内容。
例如,假设您经营一个网站,这个网站教人们如何讲法语。
您的业务涉及波士顿及其它地区。
在一个页面,您围绕“Learn French Boston(在波士顿地区学法语)”进行页面优化。
另一个页面正在尝试为“ Learn French Cambridge(在剑桥地区学法语)”排名。
严格地说,这2个页面的内容是有区别的。例如,一个页面上是波士顿的地址,而另一个页面上是剑桥的地址。
但是,这2个页面上的大部分的内容,是非常相似的。
从技术上讲,这是重复的内容。
让每一个页面上的内容都独一无二,这可不是一件简单的事情。但是,如果你想要每个页面都有排名,那你必须这样做。
使用规范化标记(Canonical Tag)
rel=canonical标签告诉搜索引擎:
“是的,我们有一些重复内容。但是 这个 页面是原始页面。您可以忽略其余的页面。”
谷歌表示,规范化标记比禁止索引重复内容更好。
(例如,使用robots.txt或网页HTML中的noindex标记阻止Googlebot )
所以,如果在您的网站上发现了重复内容,可以用以下三种方法:删除它们重定向他们使用规范话标记
使用工具
有一些seo工具具有发现重复内容的功能。
例如,Siteliner会扫描您的网站,发现包含大量重复内容的页面。
合并页面
我之前提过,如果您有很多页面包含重复内容,您很可能会把它们重定向到一个页面。
(或使用规范化标记)
但是,如果页面具有相似的内容怎么办?
可以为每个页面打磨出独特的内容,也可以把它们合并成一个“大”页面。
比如说,假设您的网站上有3篇博客。严格地说,它们是有区别的。但是它们的内容几乎相同。
您可以将这3篇文章合并,变成一篇优质的、原创的文章。
因为您删除了一些重复的内容,所以这个页面的排名会高于3个分开页面的排名总和。
Noindex WordPress标签或分类页面
如果您使用WordPress,您可能已经注意到它会自动生成标签和分类页面。
这些页面是重复内容的主要来源。
因此它们对用户很有用,我建议在这些页面上添加“ noindex”标签。这样,它们可以存在,但无需搜索引擎为它们建立索引。
也可以在WordPress中进行设置,不让这些页面生成。