Duplicate Content bezieht sich im Allgemeinen auf inhaltliche Inhaltsblöcke innerhalb oder über Domänen hinweg, die entweder vollständig mit anderen Inhalten übereinstimmen oder sich deutlich ähneln. Meistens täuscht dies nicht im Ursprung. Beispiele für nicht bösartige doppelte Inhalte können sein:
- Diskussionsforen, die sowohl reguläre als auch abgespeckte Seiten für mobile Geräte generieren können
- Artikel in einem Online-Shop, die durch mehrere unterschiedliche URLs angezeigt oder verlinkt werden
- Druckerversionen von Webseiten
Wenn Ihre Website mehrere Seiten mit weitgehend identischem Inhalt enthält, können Sie Google auf verschiedene Arten Ihre bevorzugte URL angeben. (Dies wird als „Kanonisierung“ bezeichnet.) Weitere Informationen zur Kanonisierung.
In einigen Fällen werden Inhalte jedoch absichtlich domänenübergreifend dupliziert, um Suchmaschinenrankings zu manipulieren oder mehr Traffic zu gewinnen. Betrügerische Praktiken wie diese können zu einer schlechten Benutzererfahrung führen, wenn ein Besucher im Wesentlichen denselben Inhalt in einer Reihe von Suchergebnissen wiederholt sieht.
Google ist bemüht, Seiten mit eindeutigen Informationen zu indizieren und anzuzeigen. Diese Filterung bedeutet zum Beispiel, dass, wenn Ihre Website eine „reguläre“ und „Druckversion“ jedes Artikels hat und keiner von ihnen mit einem noindex
-Tag blockiert ist, wir einen von ihnen zur Liste auswählen. In den seltenen Fällen, in denen Google feststellt, dass Duplicate Content mit der Absicht angezeigt wird, unsere Rankings zu manipulieren und unsere Nutzer zu täuschen, nehmen wir auch entsprechende Anpassungen bei der Indizierung und dem Ranking der betreffenden Websites vor. Infolgedessen kann das Ranking der Website darunter leiden oder die Website wird vollständig aus dem Google-Index entfernt.
Es gibt einige Schritte, die Sie unternehmen können, um Probleme mit doppelten Inhalten proaktiv zu beheben und sicherzustellen, dass Besucher die Inhalte sehen, die sie möchten.
- Verwenden 301 s: Wenn Sie Ihre Website umstrukturiert haben, verwenden 301 Umleitungen („RedirectPermanent“) in Ihrem .htaccess-Datei, um Benutzer, Googlebot und andere Spinnen intelligent umzuleiten. (In Apache können Sie dies mit einem tun.htaccess-Datei; In IIS können Sie dies über die Verwaltungskonsole tun.)
- Seien Sie konsistent: Versuchen Sie, Ihre interne Verknüpfung konsistent zu halten. Verknüpfen Sie beispielsweise nicht mit
http://www.example.com/page/
undhttp://www.example.com/page
undhttp://www.example.com/page/index.htm
. - Top-Level-Domains verwenden: Um die am besten geeignete Version eines Dokuments bereitzustellen, verwenden Sie nach Möglichkeit Top-Level-Domains, um länderspezifische Inhalte zu verarbeiten. Wir wissen eher, dass
http://www.example.de
beispielsweise auf Deutschland ausgerichtete Inhalte enthält alshttp://www.example.com/de
oderhttp://de.example.com
. - Syndizieren Sie sorgfältig: Wenn Sie Ihre Inhalte auf anderen Websites syndizieren, zeigt Google bei jeder Suche immer die Version an, die unserer Meinung nach für die Nutzer am besten geeignet ist. Es ist jedoch hilfreich, sicherzustellen, dass jede Website, auf der Ihre Inhalte syndiziert werden, einen Link zu Ihrem ursprünglichen Artikel enthält. Sie können auch diejenigen, die Ihr syndiziertes Material verwenden, bitten, das
noindex
-Tag zu verwenden, um zu verhindern, dass Suchmaschinen ihre Version des Inhalts indizieren. - Minimieren Sie die Wiederholung von Textbausteinen: Anstatt beispielsweise langen Copyright-Text am Ende jeder Seite einzufügen, fügen Sie eine sehr kurze Zusammenfassung hinzu und verlinken Sie dann auf eine Seite mit weiteren Details. Darüber hinaus können Sie mit dem Parameterhandhabungstool angeben, wie Google URL-Parameter behandeln soll.
- Vermeiden Sie das Veröffentlichen von Stubs: Benutzer mögen es nicht, „leere“ Seiten zu sehen. Veröffentlichen Sie beispielsweise keine Seiten, für die Sie noch keinen echten Inhalt haben. Wenn Sie Platzhalterseiten erstellen, verwenden Sie das
noindex
-Tag, um die Indizierung dieser Seiten zu blockieren. - Verstehen Sie Ihr Content-Management-System: Stellen Sie sicher, dass Sie mit der Darstellung von Inhalten auf Ihrer Website vertraut sind. Blogs, Foren und verwandte Systeme zeigen häufig denselben Inhalt in mehreren Formaten. Ein Blogeintrag kann beispielsweise auf der Startseite eines Blogs, auf einer Archivseite und auf einer Seite mit anderen Einträgen mit demselben Label angezeigt werden.
- Minimieren Sie ähnliche Inhalte: Wenn Sie viele Seiten haben, die ähnlich sind, sollten Sie jede Seite erweitern oder die Seiten zu einer konsolidieren. Wenn Sie beispielsweise eine Reisewebsite mit separaten Seiten für zwei Städte, aber denselben Informationen auf beiden Seiten haben, können Sie die Seiten entweder zu einer Seite über beide Städte zusammenführen oder jede Seite erweitern, um eindeutige Inhalte über jede Stadt zu enthalten.
Google empfiehlt nicht, den Crawler-Zugriff auf doppelte Inhalte auf Ihrer Website zu blockieren, sei es mit einem Roboter.txt-Datei oder andere Methoden. Wenn Suchmaschinen keine Seiten mit doppelten Inhalten crawlen können, können sie nicht automatisch erkennen, dass diese URLs auf denselben Inhalt verweisen, und müssen sie daher effektiv als separate, eindeutige Seiten behandeln. Eine bessere Lösung besteht darin, Suchmaschinen zu erlauben, diese URLs zu crawlen, sie jedoch als Duplikate zu markieren, indem Sie das Linkelement rel="canonical"
, das URL-Parameterhandling-Tool oder 301-Weiterleitungen verwenden. In Fällen, in denen doppelte Inhalte dazu führen, dass wir zu viel von Ihrer Website crawlen, können Sie auch die Crawling-Rate in der Search Console anpassen.
Doppelte Inhalte auf einer Website sind kein Grund zum Handeln auf dieser Website, es sei denn, es scheint, dass die Absicht des doppelten Inhalts darin besteht, irreführend zu sein und Suchmaschinenergebnisse zu manipulieren. Wenn Ihre Website unter Duplicate Content-Problemen leidet und Sie den oben aufgeführten Ratschlägen nicht folgen, wählen wir eine Version des Inhalts aus, die in unseren Suchergebnissen angezeigt werden soll.
Wenn unsere Überprüfung jedoch ergab, dass Sie betrügerische Praktiken betrieben haben und Ihre Website aus unseren Suchergebnissen entfernt wurde, überprüfen Sie Ihre Website sorgfältig. Wenn Ihre Website aus unseren Suchergebnissen entfernt wurde, lesen Sie unsere Webmaster-Richtlinien für weitere Informationen. Sobald Sie Ihre Änderungen vorgenommen haben und sicher sind, dass Ihre Website nicht mehr gegen unsere Richtlinien verstößt, reichen Sie Ihre Website zur erneuten Prüfung ein.
In seltenen Fällen kann unser Algorithmus eine URL von einer externen Website auswählen, die Ihre Inhalte ohne Ihre Erlaubnis hostet. Wenn Sie der Meinung sind, dass eine andere Website Ihre Inhalte unter Verstoß gegen das Urheberrecht dupliziert, können Sie sich an den Host der Website wenden, um die Entfernung zu beantragen. Darüber hinaus können Sie Google auffordern, die rechtsverletzende Seite aus unseren Suchergebnissen zu entfernen, indem Sie einen Antrag gemäß dem Digital Millennium Copyright Act stellen.