중복 콘텐츠는 일반적으로 다른 콘텐츠와 완전히 일치하거나 상당히 유사한 도메인 내 또는 도메인 간 콘텐츠의 실질적인 블록을 지칭한다. 대부분,이 기원에 현혹되지 않습니다. 비 악의적인 중복 콘텐츠의 예는 다음과 같습니다:웹 페이지의 프린터 전용 버전
사이트에 대부분 동일한 콘텐츠를 가진 여러 페이지가 포함되어 있는 경우,원하는 페이지를 구글에 표시할 수 있는 여러 가지 방법이 있습니다. (이를”정규화”라고합니다.)표준화에 대한 자세한 정보.
그러나,일부 경우에,콘텐츠는 검색 엔진 순위를 조작하거나 더 많은 트래픽을 획득하기 위해 도메인 간에 의도적으로 복제된다. 이와 같은 사기성 관행은 방문자가 검색 결과 집합 내에서 반복되는 동일한 콘텐츠를 실질적으로 볼 때 사용자 경험이 저하 될 수 있습니다.
구글은 색인과 별개의 정보를 표시 페이지를 열심히 시도합니다. 예를 들어,이 필터링은 사이트에 각 기사의”일반”및”프린터”버전이 있고 이들 중 어느 것도noindex
태그로 차단되지 않은 경우 나열 할 태그 중 하나를 선택합니다. 구글은 중복 콘텐츠가 우리의 순위를 조작하고 사용자를 속일 목적으로 표시 될 수 있음을 인식하는 드문 경우에,우리는 또한 관련 사이트의 색인 및 순위에 적절한 조정을 할 것입니다. 그 결과,사이트의 순위가 저하 될 수 있습니다,또는 사이트가 구글 인덱스에서 완전히 제거 될 수 있습니다,이 경우 더 이상 검색 결과에 표시되지 않습니다.
중복 콘텐츠 문제를 사전에 해결하고 방문자가 원하는 콘텐츠를 볼 수 있도록 하기 위해 취할 수 있는 몇 가지 단계가 있습니다.
- 301 초 사용: 사이트를 재구성 한 경우 301 리디렉션(“리디렉션 영구”)을 사용하십시오.사용자,구글 봇 및 기타 스파이더를 똑똑하게 리디렉션하는 파일. (아파치에서,당신은 이것을 할 수 있습니다.관리 콘솔을 통해 이 작업을 수행할 수 있습니다.)
- 일관성 유지:내부 연결을 일관되게 유지하십시오. 예를 들어
http://www.example.com/page/
및http://www.example.com/page
및http://www.example.com/page/index.htm
에 연결하지 마십시오. - 최상위 도메인 사용:문서의 가장 적합한 버전을 제공하려면 가능하면 최상위 도메인을 사용하여 국가별 콘텐츠를 처리합니다. 예를 들어
http://www.example.com/de
또는http://de.example.com
보다http://www.example.de
에 독일 중심의 콘텐츠가 포함되어 있다는 것을 알 가능성이 더 큽니다. - 신중하게 신디케이트:다른 사이트에서 콘텐츠를 신디케이트하는 경우,구글은 항상 우리가 각 주어진 검색에서 사용자에게 가장 적합하다고 생각하는 버전을 표시합니다. 그런데,너의 내용이 신디케이트로 조직되는 각 위치가 너의 원래 기사등을맞댄 연결을 포함하는 것을 지키는것은 도움이 된다. 당신은 또한 당신의 신디케이트로 조직한 물자를 수색 엔진이 내용의 그들의 버전을 색인을 붙이는 것을 막기 위하여
noindex
꼬리표를 이용하도록 이용하는 사람들을 요구할 수 있다. - 상용구 반복 최소화:예를 들어,모든 페이지 하단에 긴 저작권 텍스트를 포함하는 대신 매우 간단한 요약을 포함시킨 다음 자세한 내용이있는 페이지로 연결하십시오. 또한 매개 변수 처리 도구를 사용하여 매개 변수를 처리하는 방법을 지정할 수 있습니다.
- 게시 스텁 피하기:사용자는”빈”페이지를 보는 것을 좋아하지 않으므로 가능한 경우 자리 표시자를 피하십시오. 예를 들어 실제 콘텐츠가 아직 없는 페이지를 게시하지 마십시오. 자리 표시자 페이지를 만드는 경우
noindex
태그를 사용하여 이러한 페이지의 색인이 생성되지 않도록 합니다. - 콘텐츠 관리 시스템 이해:웹 사이트에 콘텐츠가 표시되는 방식을 잘 알고 있어야 합니다. 블로그,포럼 및 관련 시스템은 종종 동일한 콘텐츠를 여러 형식으로 표시합니다. 예를 들어 블로그 항목은 블로그의 홈 페이지,아카이브 페이지 및 레이블이 같은 다른 항목의 페이지에 나타날 수 있습니다.
- 유사 콘텐츠 최소화: 비슷한 페이지가 많은 경우 각 페이지를 확장하거나 페이지를 하나로 통합하는 것을 고려하십시오. 예를 들어 두 도시에 대해 별도의 페이지가 있지만 두 페이지에 동일한 정보가 있는 여행 사이트가 있는 경우 페이지를 두 도시에 대한 한 페이지로 병합하거나 각 페이지를 확장하여 각 도시에 대한 고유한 콘텐츠를 포함할 수 있습니다.
구글은 당신의 웹 사이트에 콘텐츠를 복제 크롤러 액세스를 차단하지 않는 것이 좋습니다,로봇 여부.파일 또는 다른 방법. 검색엔진이 중복 콘텐츠로 페이지를 크롤링할 수 없는 경우 이러한 페이지가 동일한 콘텐츠를 가리킨다는 것을 자동으로 감지할 수 없으므로 해당 페이지를 별도의 고유 페이지로 처리해야 합니다. 검색 엔진에서 이러한 링크를 크롤링할 수 있도록 하는 것이 좋습니다. 중복 콘텐츠로 인해 웹 사이트가 너무 많이 크롤링되는 경우 검색 콘솔에서 크롤링 속도 설정을 조정할 수도 있습니다.
사이트의 중복 콘텐츠는 중복 콘텐츠의 의도가 기만적이고 검색 엔진 결과를 조작하는 것으로 보이지 않는 한 해당 사이트에서의 행동 근거가 아닙니다. 귀하의 사이트가 중복 콘텐츠 문제로 고통,당신은 위에 나열된 조언을 따르지 않는 경우,우리는 우리의 검색 결과에 표시 할 콘텐츠의 버전을 선택하는 좋은 일을.
그러나,우리의 검토는 당신이 사기성 관행에 종사하고 귀하의 사이트가 우리의 검색 결과에서 제거 된 것으로 표시 한 경우,신중하게 사이트를 검토. 귀하의 사이트가 우리의 검색 결과에서 제거 된 경우,자세한 내용은 웹 마스터 가이드 라인을 검토. 변경한 후 사이트가 더 이상 지침을 위반하지 않는다고 확신하면 재검토를 위해 사이트를 제출하십시오.
드문 경우에,우리의 알고리즘은 사용자의 허가없이 콘텐츠를 호스팅하는 외부 사이트에서 사이트를 선택할 수 있습니다. 다른 사이트가 저작권법을 위반하여 콘텐츠를 복제하고 있다고 생각되면 사이트 호스트에 연락하여 삭제를 요청할 수 있습니다. 또한,당신은 구글이 디지털 밀레니엄 저작권법에 따라 요청을 제출하여 우리의 검색 결과에서 침해 페이지를 제거하도록 요청할 수 있습니다.