Duplicate content verwijst over het algemeen naar inhoudelijke blokken van content binnen of tussen domeinen die volledig overeenkomen met andere content of aanzienlijk vergelijkbaar zijn. Meestal is dit niet misleidend van oorsprong. Voorbeelden van niet-kwaadaardige dubbele inhoud kunnen zijn:
- discussieforums die zowel reguliere als gestripte pagina ’s kunnen genereren die gericht zijn op mobiele apparaten
- Items in een online winkel die worden weergegeven of gekoppeld door meerdere afzonderlijke URL’ s
- Printerversies van webpagina ‘s
als uw site meerdere pagina’ s bevat met grotendeels identieke inhoud, zijn er een aantal manieren waarop u uw voorkeurs-URL naar Google kunt aangeven. (Dit wordt “canonicalisatie” genoemd.) Meer informatie over canonicalisatie.
echter, in sommige gevallen wordt inhoud opzettelijk over domeinen gedupliceerd in een poging om zoekmachine rankings te manipuleren of meer verkeer te winnen. Misleidende praktijken als deze kunnen resulteren in een slechte gebruikerservaring, wanneer een bezoeker in wezen dezelfde inhoud herhaald ziet binnen een set van zoekresultaten.
Google probeert pagina ‘ s met duidelijke informatie te indexeren en weer te geven. Dit filteren betekent bijvoorbeeld dat als uw site een “gewone” en “printer” versie van elk artikel heeft, en geen van beide is geblokkeerd met een noindex
tag, we er een zullen kiezen om te tonen. In de zeldzame gevallen waarin Google opmerkt dat dubbele inhoud kan worden weergegeven met de bedoeling onze ranglijsten te manipuleren en onze gebruikers te misleiden, zullen we ook passende aanpassingen aanbrengen in de indexering en ranking van de betrokken sites. Als gevolg hiervan kan de ranking van de site eronder lijden, of kan de site volledig uit de Google-index worden verwijderd, in welk geval de site niet meer in de zoekresultaten wordt weergegeven.
er zijn enkele stappen die u kunt nemen om problemen met dubbele inhoud proactief aan te pakken en ervoor te zorgen dat bezoekers de inhoud zien die u wilt.
- gebruik 301s: Als u uw site hebt geherstructureerd, gebruik 301 redirects (“RedirectPermanent”) in uw .htaccess-bestand om gebruikers, Googlebot en andere spiders slim om te leiden. (In Apache kun je dit doen met een.htaccess-bestand; in IIS kunt u dit doen via de beheerconsole.)
- Wees consistent: probeer uw interne koppeling consistent te houden. Koppel bijvoorbeeld niet aan
http://www.example.com/page/
enhttp://www.example.com/page
enhttp://www.example.com/page/index.htm
. - gebruik topniveaudomeinen: om ons te helpen de meest geschikte versie van een document te gebruiken, gebruik topniveaudomeinen waar mogelijk om landspecifieke inhoud af te handelen. Het is waarschijnlijker dat
http://www.example.de
bijvoorbeeld Duitse inhoud bevat danhttp://www.example.com/de
ofhttp://de.example.com
. - Syndicaat zorgvuldig: als u uw inhoud op andere sites syndiceert, zal Google altijd de versie laten zien waarvan wij denken dat deze het meest geschikt is voor gebruikers in elke zoekopdracht, wat wel of niet de versie kan zijn die u verkiest. Echter, het is nuttig om ervoor te zorgen dat elke site waarop uw inhoud wordt gesyndiceerd bevat een link terug naar uw oorspronkelijke artikel. U kunt degenen die uw gesyndiceerde materiaal gebruiken ook vragen om de
noindex
tag te gebruiken om te voorkomen dat zoekmachines hun versie van de inhoud indexeren. - minimaliseer herhaling van boilerplate: bijvoorbeeld, in plaats van lange copyrighttekst onderaan elke pagina op te nemen, een zeer korte samenvatting en vervolgens een link naar een pagina met meer details. Daarnaast kunt u de Parameter Handling tool gebruiken om aan te geven hoe u wilt dat Google URL parameters te behandelen.
- vermijd het publiceren van stubs: gebruikers vinden het niet leuk om “lege” pagina ‘ s te zien, dus vermijd waar mogelijk placeholders. Publiceer bijvoorbeeld geen pagina ‘ s waarvoor je nog geen echte inhoud hebt. Als u placeholder-Pagina ’s maakt, gebruikt u de tag
noindex
om te voorkomen dat deze pagina’ s geïndexeerd worden. - begrijp uw content management systeem: zorg ervoor dat u bekend bent met hoe inhoud wordt weergegeven op uw website. Blogs, forums en gerelateerde systemen tonen vaak dezelfde inhoud in meerdere formaten. Bijvoorbeeld, een blog item kan worden weergegeven op de homepage van een blog, in een archief pagina, en in een pagina van andere items met hetzelfde label.
- minimaliseer vergelijkbare inhoud: Als u veel pagina ’s hebt die vergelijkbaar zijn, overweeg dan om elke pagina uit te breiden of de pagina’ s te consolideren tot één pagina. Als u bijvoorbeeld een reiswebsite hebt met afzonderlijke pagina ’s voor twee steden, maar dezelfde informatie op beide pagina’ s, kunt u de pagina ‘ s samenvoegen tot één pagina over beide steden of u kunt elke pagina uitbreiden om unieke inhoud over elke stad te bevatten.
Google raadt niet aan om crawler-toegang tot duplicaatcontent op uw website te blokkeren, ook niet met robots.txt-bestand of andere methoden. Als zoekmachines geen pagina ’s met dubbele inhoud kunnen crawlen, kunnen ze niet automatisch detecteren dat deze URL’ s naar dezelfde inhoud verwijzen en zullen ze daarom effectief moeten behandelen als aparte, unieke pagina ‘ s. Een betere oplossing is om zoekmachines toe te staan deze URL ‘ s te doorzoeken, maar ze als duplicaten te markeren met het rel="canonical"
link element, het URL parameter handling tool, of 301 redirects. In gevallen waarin duplicate content ertoe leidt dat we te veel van uw website kruipen, kunt u ook de instelling crawl rate aanpassen in de Zoekconsole.
Duplicate content op een site is geen reden voor actie op die site, tenzij blijkt dat de bedoeling van de duplicate content is om bedrieglijk te zijn en zoekmachineresultaten te manipuleren. Als uw site lijdt aan dubbele content problemen, en u niet het advies hierboven vermeld volgen, we doen een goed werk van het kiezen van een versie van de content te laten zien in onze zoekresultaten.
echter, als onze beoordeling aangeeft dat u betrokken bent bij misleidende praktijken en uw site is verwijderd uit onze zoekresultaten, Bekijk uw site zorgvuldig. Als uw site is verwijderd uit onze zoekresultaten, Bekijk onze Webmaster richtlijnen voor meer informatie. Zodra u uw wijzigingen hebt aangebracht en er zeker van bent dat uw site niet langer in strijd is met onze richtlijnen, dient u uw site ter heroverweging in.
in zeldzame situaties kan ons algoritme een URL selecteren van een externe site die uw inhoud host zonder uw toestemming. Als u van mening bent dat een andere site uw inhoud dupliceert in strijd met het auteursrecht, kunt u contact opnemen met de host van de site om verwijdering te vragen. Daarnaast kunt u Google Verzoeken de inbreukmakende pagina uit onze zoekresultaten te verwijderen door een verzoek in te dienen onder de Digital Millennium Copyright Act.