Evitar crear contenido duplicado

El contenido duplicado generalmente se refiere a bloques sustantivos de contenido dentro o entre dominios que coinciden completamente con otros contenidos o son apreciablemente similares. En su mayoría, esto no es de origen engañoso. Ejemplos de contenido duplicado no malicioso podrían incluir:

  • Foros de discusión que pueden generar páginas regulares y reducidas dirigidas a dispositivos móviles
  • Artículos en una tienda en línea que se muestran o se vinculan a través de múltiples URL distintas
  • Versiones de páginas web solo para impresora

Si tu sitio contiene varias páginas con contenido prácticamente idéntico, hay varias formas de indicar a Google tu URL preferida. (Esto se llama «canonicalización».) Más información sobre canonicalización.

Sin embargo, en algunos casos, el contenido se duplica deliberadamente entre dominios en un intento de manipular las clasificaciones de los motores de búsqueda o ganar más tráfico. Prácticas engañosas como esta pueden resultar en una mala experiencia de usuario, cuando un visitante ve sustancialmente el mismo contenido repetido dentro de un conjunto de resultados de búsqueda.

Google se esfuerza por indexar y mostrar páginas con información distinta. Este filtrado significa, por ejemplo, que si su sitio tiene una versión» normal «e» impresora » de cada artículo, y ninguno de estos está bloqueado con una etiqueta noindex, elegiremos uno de ellos para enumerarlo. En los raros casos en que Google perciba que se puede mostrar contenido duplicado con la intención de manipular nuestras clasificaciones y engañar a nuestros usuarios, también haremos los ajustes apropiados en la indexación y clasificación de los sitios involucrados. Como resultado, la clasificación del sitio puede sufrir, o el sitio puede eliminarse por completo del índice de Google, en cuyo caso ya no aparecerá en los resultados de búsqueda.

Hay algunos pasos que puede seguir para abordar de forma proactiva los problemas de contenido duplicado y asegurarse de que los visitantes vean el contenido que desea que vean.

  • Use 301s: Si has reestructurado tu sitio, usa redirecciones 301 («RedirectPermanent») en tu sitio .archivo htaccess para redirigir de forma inteligente a usuarios, Googlebot y otras arañas. (En Apache, puedes hacer esto con un .archivo htaccess; en IIS, puede hacerlo a través de la consola administrativa.)
  • Sea consistente: Trate de mantener su enlace interno consistente. Por ejemplo, no vincule a http://www.example.com/page/, http://www.example.com/page y http://www.example.com/page/index.htm.
  • Usar dominios de nivel superior: Para ayudarnos a ofrecer la versión más adecuada de un documento, use dominios de nivel superior siempre que sea posible para manejar contenido específico de un país. Es más probable que sepamos que http://www.example.de contiene contenido centrado en Alemania, por ejemplo, que http://www.example.com/de o http://de.example.com.
  • Sindicar con cuidado :Si sindicas tu contenido en otros sitios, Google siempre mostrará la versión que creemos que es más adecuada para los usuarios en cada búsqueda, que puede o no ser la versión que prefieras. Sin embargo, es útil asegurarse de que cada sitio en el que está sindicado su contenido incluya un enlace a su artículo original. También puedes pedir a aquellos que usan tu material sindicado que usen la etiqueta noindex para evitar que los motores de búsqueda indexen su versión del contenido.
  • Minimice la repetición repetitiva: Por ejemplo, en lugar de incluir texto de copyright extenso en la parte inferior de cada página, incluya un resumen muy breve y luego enlace a una página con más detalles. Además, puede usar la herramienta de manejo de parámetros para especificar cómo desea que Google trate los parámetros de URL.
  • Evite publicar stubs: A los usuarios no les gusta ver páginas «vacías», así que evite los marcadores de posición cuando sea posible. Por ejemplo, no publiques páginas para las que aún no tengas contenido real. Si crea páginas de marcador de posición, use la etiqueta noindex para bloquear que estas páginas no se indexen.
  • Comprenda su sistema de gestión de contenido: Asegúrese de estar familiarizado con la forma en que se muestra el contenido en su sitio web. Los blogs, foros y sistemas relacionados a menudo muestran el mismo contenido en múltiples formatos. Por ejemplo, una entrada de blog puede aparecer en la página de inicio de un blog, en una página de archivo y en una página de otras entradas con la misma etiqueta.
  • Minimizar contenido similar: Si tiene muchas páginas que son similares, considere expandir cada página o consolidar las páginas en una sola. Por ejemplo, si tienes un sitio de viajes con páginas separadas para dos ciudades, pero con la misma información en ambas, puedes fusionar las páginas en una página sobre ambas ciudades o puedes expandir cada página para que contenga contenido único sobre cada ciudad.

Google no recomienda bloquear el acceso de rastreadores a contenido duplicado en su sitio web, ya sea con robots.archivo txt u otros métodos. Si los motores de búsqueda no pueden rastrear páginas con contenido duplicado, no pueden detectar automáticamente que estas URL apuntan al mismo contenido y, por lo tanto, tendrán que tratarlas como páginas separadas y únicas. Una mejor solución es permitir que los motores de búsqueda rastreen estas URL, pero marcarlas como duplicadas utilizando el elemento de enlace rel="canonical", la herramienta de manejo de parámetros de URL o redirecciones 301. En los casos en que el contenido duplicado nos lleve a rastrear demasiado de tu sitio web, también puedes ajustar la configuración de velocidad de rastreo en la Consola de búsqueda.

El contenido duplicado en un sitio no es motivo de acción en ese sitio a menos que parezca que la intención del contenido duplicado es engañar y manipular los resultados de los motores de búsqueda. Si tu sitio tiene problemas de contenido duplicado y no sigues los consejos mencionados anteriormente, hacemos un buen trabajo al elegir una versión del contenido para mostrar en nuestros resultados de búsqueda.

Sin embargo, si nuestra revisión indicó que usted participó en prácticas engañosas y su sitio ha sido eliminado de nuestros resultados de búsqueda, revise su sitio cuidadosamente. Si su sitio ha sido eliminado de nuestros resultados de búsqueda, revise nuestras Directrices para Webmasters para obtener más información. Una vez que haya realizado los cambios y esté seguro de que su sitio ya no infringe nuestras directrices, envíe su sitio para que lo reconsidere.

En raras ocasiones, nuestro algoritmo puede seleccionar una URL de un sitio externo que aloja su contenido sin su permiso. Si cree que otro sitio está duplicando su contenido en violación de la ley de derechos de autor, puede comunicarse con el host del sitio para solicitar la eliminación. Además, puede solicitar que Google elimine la página infractora de nuestros resultados de búsqueda presentando una solicitud en virtud de la Ley de Derechos de Autor del Milenio Digital.

You might also like

Deja una respuesta

Tu dirección de correo electrónico no será publicada.