conținutul duplicat se referă în general la blocuri substanțiale de conținut din sau între domenii care fie se potrivesc complet cu alt conținut, fie sunt semnificativ similare. În mare parte, acest lucru nu este înșelător în origine. Exemple de conținut duplicat non-rău intenționat ar putea include:
- forumuri de discuții care pot genera atât pagini obișnuite, cât și pagini decupate destinate dispozitivelor mobile
- articole dintr-un magazin online care sunt afișate sau legate de mai multe adrese URL distincte
- versiuni numai pentru imprimantă ale paginilor web
dacă site-ul dvs. conține mai multe pagini cu conținut în mare parte identic, există o serie de modalități prin care puteți indica adresa URL preferată către Google. (Aceasta se numește „canonicalizare”.) Mai multe informații despre canonicalizare.
cu toate acestea, în unele cazuri, conținutul este duplicat în mod deliberat între domenii, în încercarea de a manipula clasamentele motoarelor de căutare sau de a câștiga mai mult trafic. Practicile înșelătoare ca aceasta pot duce la o experiență slabă a utilizatorului, atunci când un vizitator vede în mod substanțial același conținut repetat într-un set de rezultate de căutare.
Google încearcă din greu să indexeze și să afișeze pagini cu informații distincte. Această filtrare înseamnă, de exemplu, că dacă site-ul dvs. are o versiune „obișnuită” și „imprimantă” a fiecărui articol și niciuna dintre acestea nu este blocată cu o etichetă noindex
, vom alege una dintre ele pe care să o listăm. În cazurile rare în care Google percepe că poate fi afișat conținut duplicat cu intenția de a manipula clasamentele noastre și de a înșela utilizatorii noștri, vom face, de asemenea, ajustări adecvate în indexarea și clasarea site-urilor implicate. Ca urmare, clasamentul site-ului poate suferi sau site-ul ar putea fi eliminat în întregime din indexul Google, caz în care acesta nu va mai apărea în rezultatele căutării.
există câțiva pași pe care îi puteți face pentru a aborda proactiv problemele legate de conținutul duplicat și pentru a vă asigura că vizitatorii văd conținutul pe care doriți să îl facă.
- utilizați 301s: Dacă v-ați restructurat site-ul, utilizați 301 redirecționări („RedirectPermanent”) în dvs.fișier htaccess pentru a redirecționa inteligent utilizatorii, Googlebot și alți păianjeni. (În Apache, puteți face acest lucru cu un .fișier htaccess; în IIS, puteți face acest lucru prin consola administrativă.)
- fii consecvent: încercați să păstrați legătura internă consecventă. De exemplu, nu conectați la
http://www.example.com/page/
șihttp://www.example.com/page
șihttp://www.example.com/page/index.htm
. - utilizarea domeniilor de nivel superior: pentru a ne ajuta să furnizăm cea mai potrivită versiune a unui document, utilizați domenii de nivel superior ori de câte ori este posibil pentru a gestiona conținutul specific țării. Este mai probabil să știm că
http://www.example.de
conține conținut orientat spre Germania, de exemplu, decâthttp://www.example.com/de
sauhttp://de.example.com
. - sindicalizați cu atenție: dacă sindicalizați conținutul dvs. pe alte site-uri, Google va afișa întotdeauna versiunea pe care o considerăm cea mai potrivită pentru utilizatorii din fiecare căutare dată, care poate fi sau nu versiunea pe care o preferați. Cu toate acestea, este util să vă asigurați că fiecare site pe care este sindicalizat conținutul dvs. include un link înapoi la articolul dvs. original. De asemenea, puteți solicita celor care utilizează materialul dvs. sindicalizat să utilizeze eticheta
noindex
pentru a împiedica motoarele de căutare să indexeze versiunea conținutului. - minimizați repetarea șablonului: de exemplu, în loc să includeți text lung privind drepturile de autor în partea de jos a fiecărei pagini, includeți un rezumat foarte scurt și apoi conectați-vă la o pagină cu mai multe detalii. În plus, puteți utiliza instrumentul de gestionare a parametrilor pentru a specifica modul în care doriți ca Google să trateze parametrii URL.
- evitați publicarea butucurilor: utilizatorilor nu le place să vadă pagini „goale”, deci evitați substituenții acolo unde este posibil. De exemplu, nu publicați pagini pentru care nu aveți încă conținut real. Dacă creați pagini substituent, utilizați eticheta
noindex
pentru a bloca indexarea acestor pagini. - înțelegeți sistemul dvs. de gestionare a conținutului: asigurați-vă că sunteți familiarizat cu modul în care este afișat conținutul pe site-ul dvs. web. Blogurile, forumurile și sistemele conexe prezintă adesea același conținut în mai multe formate. De exemplu, o intrare de blog poate apărea pe pagina de pornire a unui blog, într-o pagină de arhivă și într-o pagină cu alte intrări cu aceeași etichetă.
- minimizați conținutul similar: Dacă aveți multe pagini similare, luați în considerare extinderea fiecărei pagini sau consolidarea paginilor într-una. De exemplu, dacă aveți un site de călătorie cu pagini separate pentru două orașe, dar aceleași informații pe ambele pagini, puteți fie să îmbinați paginile într-o singură pagină despre ambele orașe, fie să extindeți fiecare pagină pentru a conține conținut unic despre fiecare oraș.
Google nu recomandă blocarea accesului pe șenile la conținutul duplicat de pe site-ul dvs. web, fie cu un robot.fișier txt sau alte metode. Dacă motoarele de căutare nu pot accesa cu crawlere pagini cu conținut duplicat, nu pot detecta automat că aceste adrese URL indică același conținut și, prin urmare, vor trebui să le trateze în mod eficient ca pagini separate, unice. O soluție mai bună este să permiteți motoarelor de căutare să acceseze cu crawlere aceste adrese URL, dar să le marcheze ca duplicate utilizând elementul de legătură rel="canonical"
, instrumentul de gestionare a parametrilor URL sau redirecționările 301. În cazurile în care conținutul duplicat ne face să accesăm cu crawlere prea mult site-ul dvs. web, puteți ajusta, de asemenea, setarea ratei de accesare cu crawlere în Search Console.
conținutul duplicat de pe un site nu este un motiv de acțiune pe site-ul respectiv, cu excepția cazului în care se pare că intenția conținutului duplicat este de a fi înșelătoare și de a manipula rezultatele motorului de căutare. Dacă site-ul dvs. suferă de probleme de conținut duplicat și nu urmați sfaturile enumerate mai sus, facem o treabă bună de a alege o versiune a conținutului pentru a fi afișată în rezultatele căutării noastre.
cu toate acestea, dacă recenzia noastră indică faptul că v-ați angajat în practici înșelătoare și site-ul dvs. a fost eliminat din rezultatele noastre de căutare, examinați-vă site-ul cu atenție. Dacă site-ul dvs. a fost eliminat din rezultatele căutării, consultați instrucțiunile pentru webmasteri pentru mai multe informații. După ce ați făcut modificările și sunteți sigur că site-ul dvs. nu mai încalcă regulile noastre, trimiteți site-ul dvs. pentru reexaminare.
în situații rare, algoritmul nostru poate selecta o adresă URL de pe un site extern care găzduiește conținutul dvs. fără permisiunea dvs. Dacă credeți că un alt site vă dublează conținutul încălcând legea drepturilor de autor, puteți contacta gazda site-ului pentru a solicita eliminarea. În plus, puteți solicita ca Google să elimine pagina care încalcă drepturile de autor din rezultatele noastre de căutare, depunând o cerere în temeiul Digital Millennium Copyright Act.