conteúdo duplicado geralmente refere-se a blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são sensivelmente semelhantes. Na maioria das vezes, isto não é de origem enganosa. Exemplos de conteúdo duplicado não malicioso podem incluir:
- fóruns de Discussão que pode gerar tanto regulares e despojada páginas direcionadas a dispositivos móveis
- Itens em uma loja online, que são mostrados ou ligados por vários URLs distintas
- Impressora só de versões de páginas web
Se o seu site contém várias páginas com muito conteúdo idêntico, há um número de maneiras que você pode indicar o URL de sua preferência para o Google. (Isto é chamado de “canonicalização”.) Mais informações sobre canonicalização.
no entanto, em alguns casos, o conteúdo é deliberadamente duplicado através de domínios, numa tentativa de manipular rankings do motor de busca ou ganhar mais tráfego. Práticas enganosas como esta podem resultar em uma má experiência do usuário, quando um visitante vê substancialmente o mesmo conteúdo repetido dentro de um conjunto de resultados de pesquisa.
a Google esforça-se por indexar e mostrar páginas com informações distintas. Esta filtragem significa, por exemplo, que se o seu site tem uma versão “regular” e “Impressora” de cada artigo, e nenhum destes é bloqueado com uma tag noindex
, vamos escolher um deles para listar. Nos raros casos em que o Google percebe que conteúdos duplicados podem ser mostrados com a intenção de manipular os nossos rankings e enganar os nossos utilizadores, também faremos ajustes adequados na indexação e classificação dos sites envolvidos. Como resultado, o ranking do site pode sofrer, ou o site pode ser removido inteiramente do Índice Google, caso em que ele não aparecerá mais em resultados de pesquisa.
existem algumas medidas que você pode tomar para resolver proativamente problemas de conteúdo duplicados, e garantir que os visitantes vejam o conteúdo que você deseja.
- utilizar 301 S: Se você reestruturou seu site, use 301 redirecionamentos (“RedirectPermanent”) em seu .arquivo htaccess para redirecionar os usuários, Googlebot e outras aranhas. (Em Apache, você pode fazer isso com um .htaccess file; in IIS, you can do this through the administrative console.)
- seja consistente: tente manter a sua ligação interna consistente. Por exemplo, não se ligue a
http://www.example.com/page/
ehttp://www.example.com/page
ehttp://www.example.com/page/index.htm
. - Use domínios de topo: para nos ajudar a servir a versão mais apropriada de um documento, use domínios de topo sempre que possível para lidar com conteúdo específico de país. É mais provável que saibamos que
http://www.example.de
contém conteúdos focados na Alemanha, por exemplo, do quehttp://www.example.com/de
ouhttp://de.example.com
. - Sindicato cuidadosamente: se você sindicalizar o seu conteúdo em outros sites, o Google irá sempre mostrar a versão que achamos mais apropriada para os usuários em cada pesquisa, que pode ou não ser a versão que você prefere. No entanto, é útil garantir que cada site em que o seu conteúdo é sindicado inclui um link de volta para o seu artigo original. Você também pode pedir àqueles que usam o seu material sindicado para usar a tag
noindex
para impedir que os motores de busca indexem a sua versão do conteúdo. - minimizar a repetição de boilerplate: por exemplo, em vez de incluir um extenso texto de copyright na parte inferior de cada página, incluir um resumo muito breve e, em seguida, link para uma página com mais detalhes. Além disso, você pode usar a ferramenta de tratamento de parâmetros para especificar como você gostaria que o Google tratasse os parâmetros de URL.
- evite os pubs de publicação: os utilizadores não gostam de ver páginas “vazias”, por isso evitem espaços onde possível. Por exemplo, não publique páginas para as quais ainda não tenha conteúdo real. Se criar páginas de substituição, use a etiqueta
noindex
para bloquear estas páginas de serem indexadas. - compreenda o seu sistema de gestão de conteúdo: certifique-se de que está familiarizado com a forma como o conteúdo é apresentado no seu site. Blogs, fóruns e sistemas relacionados muitas vezes mostram o mesmo conteúdo em vários formatos. Por exemplo, uma entrada no blog pode aparecer na página inicial de um blog, em uma página de arquivo, e em uma página de outras entradas com a mesma etiqueta.
- minimizar conteúdo semelhante: Se você tem muitas páginas que são semelhantes, considere expandir cada página ou consolidar as páginas em uma. Por exemplo, se você tem um site de viagens com páginas separadas para as duas cidades, mas com a mesma informação em ambas as páginas, você pode mesclar as páginas em uma página sobre ambas as cidades ou você pode expandir cada página para conter conteúdo exclusivo sobre cada cidade.
o Google não recomenda o bloqueio do acesso a conteúdos duplicados no seu site, seja com robôs.ficheiro txt ou outros métodos. Se os motores de busca não podem rastejar páginas com conteúdo duplicado, eles não podem detectar automaticamente que esses URLs apontam para o mesmo conteúdo e, portanto, efetivamente terá que tratá-los como páginas separadas e únicas. Uma solução melhor é permitir que os motores de busca rastejem estes URLs, mas marcá-los como duplicados usando o elemento rel="canonical"
link, a ferramenta de tratamento de parâmetros URL, ou 301 redirecionamentos. Nos casos em que o conteúdo duplicado nos leva a rastejar muito de seu site, você também pode ajustar a taxa de rastreamento na consola de busca.
conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado é ser enganoso e manipular os resultados do motor de busca. Se o seu site sofre de problemas de conteúdo duplicados, e você não seguir os conselhos listados acima, fazemos um bom trabalho de escolher uma versão do conteúdo para mostrar em nossos resultados de pesquisa.
no entanto, se a nossa revisão indicou que você se envolveu em práticas enganosas e seu site foi removido dos nossos resultados de pesquisa, reveja o seu site com cuidado. Se o seu site foi removido de nossos resultados de pesquisa, reveja nossas Diretrizes Webmaster para mais informações. Uma vez que você fez suas alterações e estão confiantes de que o seu site já não viola nossas Diretrizes, submeter o seu site para reconsideração.
em situações raras, nosso algoritmo pode selecionar uma URL de um site externo que está hospedando seu conteúdo SEM SUA permissão. Se você acredita que outro site está duplicando seu conteúdo em violação da lei de direitos autorais, você pode entrar em contato com o host do site para solicitar a remoção. Além disso, você pode solicitar que o Google remova a página infratora de nossos resultados de pesquisa, preenchendo um pedido ao abrigo da Lei de Direitos Autorais do Milênio Digital.