I contenuti duplicati si riferiscono generalmente a blocchi sostanziali di contenuti all’interno o tra domini che corrispondono completamente ad altri contenuti o sono sensibilmente simili. Per lo più, questo non è ingannevole in origine. Esempi di contenuti duplicati non dannosi potrebbero includere:
- forum di Discussione che possono generare sia regolare e stripped-down pagine destinate a dispositivi mobili
- Elementi in un negozio online che vengono mostrati o collegati da più distinti Url
- Printer-solo versioni di pagine web
Se il tuo sito contiene più pagine con gran parte di contenuto identico, ci sono un certo numero di modi in cui potete indicare il vostro preferito URL a Google. (Questo è chiamato “canonicalizzazione”.) Maggiori informazioni sulla canonicalizzazione.
Tuttavia, in alcuni casi, il contenuto viene deliberatamente duplicato tra domini nel tentativo di manipolare il posizionamento nei motori di ricerca o vincere più traffico. Pratiche ingannevoli come questa possono comportare una scarsa esperienza utente, quando un visitatore vede sostanzialmente lo stesso contenuto ripetuto all’interno di una serie di risultati di ricerca.
Google cerca di indicizzare e mostrare pagine con informazioni distinte. Questo filtro significa, ad esempio, che se il tuo sito ha una versione “normale” e “stampante” di ogni articolo e nessuno di questi è bloccato con un tag noindex
, sceglieremo uno di essi da elencare. Nei rari casi in cui Google percepisce che i contenuti duplicati possono essere mostrati con l’intento di manipolare le nostre classifiche e ingannare i nostri utenti, faremo anche le opportune modifiche nell’indicizzazione e nella classifica dei siti coinvolti. Di conseguenza, la classifica del sito potrebbe risentirne o il sito potrebbe essere rimosso interamente dall’indice di Google, nel qual caso non apparirà più nei risultati di ricerca.
Ci sono alcuni passaggi che puoi adottare per affrontare in modo proattivo i problemi di contenuto duplicato e assicurarti che i visitatori vedano il contenuto che desideri.
- Utilizzare 301 s: Se hai ristrutturato il tuo sito, utilizzare 301 redirect (“RedirectPermanent”) nel vostro .file htaccess per reindirizzare in modo intelligente gli utenti, Googlebot e altri spider. (In Apache, puoi farlo con un .file htaccess; in IIS, è possibile farlo tramite la console di amministrazione.)
- Sii coerente: cerca di mantenere coerente il tuo collegamento interno. Ad esempio, non collegare a
http://www.example.com/page/
ehttp://www.example.com/page
ehttp://www.example.com/page/index.htm
. - Usa i domini di primo livello: per aiutarci a servire la versione più appropriata di un documento, usa i domini di primo livello quando possibile per gestire i contenuti specifici del paese. Siamo più propensi a sapere che
http://www.example.de
contiene contenuti incentrati sulla Germania, ad esempio, rispetto ahttp://www.example.com/de
ohttp://de.example.com
. - Syndicate con attenzione: Se si syndicate i contenuti su altri siti, Google mostrerà sempre la versione che riteniamo più appropriata per gli utenti in ogni ricerca data, che può o non può essere la versione che si preferisce. Tuttavia, è utile assicurarsi che ogni sito su cui il contenuto è sindacato include un link al tuo articolo originale. Puoi anche chiedere a coloro che utilizzano il tuo materiale sindacato di utilizzare il tag
noindex
per impedire ai motori di ricerca di indicizzare la loro versione del contenuto. - Riduci al minimo la ripetizione di boilerplate: ad esempio, invece di includere un lungo testo sul copyright in fondo a ogni pagina, includi un sommario molto breve e poi collega a una pagina con maggiori dettagli. Inoltre, è possibile utilizzare lo strumento di gestione dei parametri per specificare come si desidera che Google tratti i parametri URL.
- Evita di pubblicare stub: agli utenti non piace vedere pagine “vuote”, quindi evita i segnaposto dove possibile. Ad esempio, non pubblicare pagine per le quali non si dispone ancora di contenuti reali. Se si creano pagine segnaposto, utilizzare il tag
noindex
per bloccare l’indicizzazione di queste pagine. - Comprendi il tuo sistema di gestione dei contenuti: assicurati di avere familiarità con il modo in cui i contenuti vengono visualizzati sul tuo sito web. Blog, forum e sistemi correlati spesso mostrano lo stesso contenuto in più formati. Ad esempio, una voce di blog può apparire sulla home page di un blog, in una pagina di archivio e in una pagina di altre voci con la stessa etichetta.
- Ridurre al minimo il contenuto simile: Se si dispone di molte pagine che sono simili, considerare l’espansione di ogni pagina o consolidare le pagine in una sola. Ad esempio, se si dispone di un sito di viaggi con pagine separate per due città, ma le stesse informazioni su entrambe le pagine, è possibile unire le pagine in una pagina su entrambe le città o espandere ogni pagina per contenere contenuti univoci su ciascuna città.
Google non consiglia di bloccare l’accesso crawler a contenuti duplicati sul tuo sito web, sia con un robot.file txt o altri metodi. Se i motori di ricerca non possono eseguire la scansione di pagine con contenuti duplicati, non possono rilevare automaticamente che questi URL puntano allo stesso contenuto e dovranno quindi trattarli come pagine separate e univoche. Una soluzione migliore consiste nel consentire ai motori di ricerca di eseguire la scansione di questi URL, ma contrassegnarli come duplicati utilizzando l’elemento di collegamento rel="canonical"
, lo strumento di gestione dei parametri URL o i reindirizzamenti 301. Nei casi in cui i contenuti duplicati ci portano a strisciare troppo del tuo sito web, puoi anche regolare l’impostazione della frequenza di scansione in Search Console.
Il contenuto duplicato su un sito non è motivo di azione su quel sito a meno che non appaia che l’intento del contenuto duplicato è quello di essere ingannevole e manipolare i risultati dei motori di ricerca. Se il tuo sito soffre di problemi di contenuti duplicati e non segui i consigli sopra elencati, facciamo un buon lavoro scegliendo una versione del contenuto da mostrare nei nostri risultati di ricerca.
Tuttavia, se la nostra recensione ha indicato che hai intrapreso pratiche ingannevoli e il tuo sito è stato rimosso dai nostri risultati di ricerca, rivedi attentamente il tuo sito. Se il tuo sito è stato rimosso dai nostri risultati di ricerca, consulta le nostre Linee guida per i webmaster per ulteriori informazioni. Una volta che hai apportato le modifiche e sei sicuro che il tuo sito non viola più le nostre linee guida, invia il tuo sito per una riconsiderazione.
In rare situazioni, il nostro algoritmo può selezionare un URL da un sito esterno che ospita i tuoi contenuti senza la tua autorizzazione. Se ritieni che un altro sito stia duplicando i tuoi contenuti in violazione della legge sul copyright, puoi contattare l’host del sito per richiedere la rimozione. Inoltre, puoi richiedere a Google di rimuovere la pagina in violazione dai nostri risultati di ricerca presentando una richiesta ai sensi del Digital Millennium Copyright Act.