重複コンテンツとは、一般的に、他のコンテンツと完全に一致するか、またはかなり類似しているドメイン内またはドメイン間のコンテンツの実質的なブロックを指します。 ほとんどの場合、これは起源が欺瞞的ではありません。 悪意のない重複コンテンツの例としては、次のようなものがあります:
- モバイルデバイスをターゲットにした通常のページと削除されたページの両方を生成できるディスカッションフォーラム
- オンラインストアのアイテムが複数の異なるUrlで表示またはリンクされている
- プリンタ専用のwebページ
サイトに同じコンテンツを持つ複数のページが含まれている場合、googleに好みのURLを指定する方法がいくつかあります。 (これは”正規化”と呼ばれています。)正規化についてのより多くの情報。
しかし、検索エンジンのランキングを操作したり、より多くのトラフィックを獲得しようとする試みで、コンテンツが意図的にドメイン間で複 このような欺瞞的な慣行は、訪問者が一連の検索結果内で繰り返される実質的に同じコンテンツを見ると、ユーザーエクスペリエンスが低下する可能性
Googleは、個別の情報を持つページのインデックスと表示に懸命に努めています。 このフィルタリングとは、たとえば、サイトに各記事の”通常の”バージョンと”プリンタ”バージョンがあり、これらのいずれもnoindex
タグでブロックされていない場 まれに、重複したコンテンツがランキングを操作してユーザーを欺く意図で表示される可能性があるとGoogleが認識する場合は、関連するサイトのインデックス その結果、サイトのランキングが低下したり、サイトがGoogleインデックスから完全に削除されたりする可能性があります。
重複したコンテンツの問題に積極的に対処し、訪問者が望むコンテンツを確実に表示するために実行できる手順がいくつかあります。
- 301sを使用する: サイトを再構築した場合は、301リダイレクト(”RedirectPermanent”)を使用します。スマートにユーザー、Googlebot、および他のスパイダーをリダイレクトするhtaccessファイル。 (Apacheでは、これをanで行うことができます。IISでは、管理コンソールを使用してこれを行うことができます。)
- 一貫性がある:内部リンクの一貫性を保つようにしてください。 たとえば、
http://www.example.com/page/
およびhttp://www.example.com/page
およびhttp://www.example.com/page/index.htm
にリンクしないでください。 - トップレベルドメインの使用:ドキュメントの最も適切なバージョンを提供するために、可能な限りトップレベルドメインを使用して国固有のコ たとえば、
http://www.example.de
にはhttp://www.example.com/de
やhttp://de.example.com
よりもドイツに焦点を当てたコンテンツが含まれていることを知る可能性が高くなります。 - 慎重にシンジケートする:他のサイトでコンテンツをシンジケートする場合、Googleは常に、特定の検索ごとにユーザーに最も適していると思われるバージョンを表示します。 但し、あなたの内容がシンジケートされる各場所があなたの元の記事に戻るリンクを含んでいることを保障することは有用である。 また、シンジケートされた資料を使用するユーザーに
noindex
タグを使用して、検索エンジンがコンテンツのバージョンを索引付けするのを防ぐように依頼するこ - 定型文の繰り返しを最小限に抑える:例えば、すべてのページの下部に長い著作権テキストを含めるのではなく、非常に簡単な要約を含め、より詳細なペー また、パラメータ処理ツールを使用して、GoogleがURLパラメータをどのように扱うかを指定することもできます。
- スタブの公開を避ける:ユーザーは”空の”ページを見るのが好きではないので、可能な限りプレースホルダーを避けてください。 たとえば、実際のコンテンツがまだないページを公開しないでください。 プレースホルダーページを作成する場合は、
noindex
タグを使用して、これらのページのインデックスが作成されないようにします。 - コンテンツ管理システムを理解する:webサイトでのコンテンツの表示方法に精通していることを確認してください。 ブログ、フォーラム、および関連システムでは、同じコンテンツが複数の形式で表示されることがよくあります。 たとえば、ブログエントリは、ブログのホームページ、アーカイブページ、および同じラベルを持つ他のエントリのページに表示される場合があります。
- : 類似しているページが多数ある場合は、各ページを展開するか、ページを1つに統合することを検討してください。 たとえば、2つの都市に別々のページがあり、両方のページに同じ情報がある旅行サイトがある場合は、両方の都市に関するページを1つのページにマージするか、各ページを展開して各都市に関する一意のコンテンツを含めることができます。
Googleは、ロボットを使用しているかどうかにかかわらず、ウェブサイト上の重複コンテンツへのクローラーアクセスをブロックすることはお勧めしません。txtファイルまたは他の方法。 検索エンジンが重複したコンテンツを含むページをクロールできない場合、これらのUrlが同じコンテンツを指していることを自動的に検出できないた より良い解決策は、検索エンジンがこれらのUrlをクロールできるようにすることですが、rel="canonical"
link要素、URLパラメータ処理ツール、または301リダイレクトを使用し コンテンツが重複しているためにwebサイトのクロールが過剰になる場合は、Search Consoleでクロール率の設定を調整することもできます。
サイト上の重複コンテンツは、重複コンテンツの意図が欺瞞的であり、検索エンジンの結果を操作することであると思われる場合を除き、そのサイト上の行動の根拠ではありません。 あなたのサイトが重複したコンテンツの問題に苦しんでいて、上記のアドバイスに従わない場合は、検索結果に表示するコンテンツのバージョンを選
しかし、当社のレビューであなたが欺瞞的な慣行に従事していることが示され、あなたのサイトが当社の検索結果から削除された場合は、サイトを慎重に あなたのサイトが検索結果から削除された場合は、詳細については、ウェブマスターガイドラインを確認してくださ 変更を加え、サイトがガイドラインに違反していないことを確信したら、サイトを再検討のために提出してください。
まれに、当社のアルゴリズムは、あなたの許可なしにあなたのコンテンツをホストしている外部サイトからURLを選択することがあります。 他のサイトが著作権法に違反してコンテンツを複製していると思われる場合は、サイトのホストに連絡して削除を要求することができます。 さらに、デジタルミレニアム著作権法に基づく要求を提出することにより、Googleの検索結果から侵害ページを削除するように要求することができます。