15-minutový návod na analýzu duplicít

V predchádzajúcom návode som ukazoval, ako nájsť na webe duplicitné obrázky.

Bolo to jednoduché. Obrázky si stačí zoskupiť podľa duplicít s funkciou Group by icon .

Podobne to platí aj pre HTML stránky. So Spotibo môžeš ľahko odhaliť:

  • Duplicitné stránkyGroup by icon  Duplicates
  • Duplicitné titulkyGroup by icon  Titles
  • Duplicitné nadpisyGroup by icon  H1 headings

Ako odhaliť duplicity ti ukážem na konkrétnom príklade eshopu Mall.cz. Na získanie prehľadu duplicitných stránok mi stačili 3 kliknutia. 

duplicity

Analýza duplicitného obsahu

Na Mall.cz našlo desiatky tisíc duplicít. Avšak to neznamená, že všetko sú chyby. Duplicity môžu byť ošetrené napríklad týmito spôsobmi:

  • Zakázať stránku v robots.txt.
  • Nastaviť stránke noindex.
  • Korektne definovať canonical tag.

Aby som videl len problémové duplicity, pomocou filtra som vyradil stránky so zákazom indexácie a robots.txt. Na začiatok som vyradil aj stránky s canonicalom. Výsledok vyzerá nasledovne:

Duplicity indexované

Duplicít je zrazu oveľa menej. Ak sa na URL pozrieme bližšie, opakuje sa v nich parameter „b%5B%5D„:

Tento typ duplicít by bolo potrebné opraviť. To je prvý problém.

Aby sa mi vo výsledkoch už tento problém neopakoval, vylúčil som problémové URL týmto filtrom:

Exclude param

Duplicít je zasa menej:

Duplicity terms

Pozri sa na screenshot vyššie. Čo majú URL spoločné? 

Duplicity vznikajú v slovníku pojmov. Rovnaký výraz je raz pomenovaný ako

To je ďalší problém, ktorý by mal byť vyriešený. Aby som videl ďalšie typy duplicít, filtrom vyradím aj tento parameter:

Exclude term

A výsledok? Zostali už len dva prípady duplicít. To je pre rozsiahly web zanedbateľné množstvo a nemá zmysel sa tým ďalej zaoberať.

Last duplicates

Zhrňme si to. Najskôr to vyzeralo, že je na Mall.cz obrovské množstvo duplicít. Bolo to len zdanie. Keď som vyradil stránky so zakázanou indexáciou a skanonizované URL, počet neošetrených duplicít výrazne klesol. Duplicity vznikajú len na URL, ktoré:

  • majú parameter b%5B%5D=
  • a v slovníku pojmov, pri použití parametra term=

Ako sa zbaviť duplicít?

Uvediem len jedno riešenie. To najefektívnejšie:

  1. Vyberiem si z duplicít jednu hlavnú stránku, ktorú chcem vo výsledkoch vyhľadávania zobrazovať. A tie ostatné na ňu presmerujem stavovým kódom 301. Hlavnou stránkou môže byť napr. https://www.mall.cz/slovnik-pojmu/detail?term=Korekce+expozice. Duplicity (term=exposure_correctionterm=EXPOSURE_CORRECTION) by som na ňu presmeroval kódom 301. 
  2. Na stránkach, ktoré odkazujú na duplicitity, by mali byť odkazy upravené tak, aby viedli priamo na hlavnú stránku. 

To je všetko. Ďalším riešením môže byť použitie canonical tagu. Avšak ako uvidíš ďalej, nie je na 100% spoľahlivé.

Analýza canonical tagov

URL uvedená v canonical tagu nemusí byť nevyhnutne duplicitná. Môže sa tam nachádzať URL s úplne iným obsahom. Takže zoskupenie podľa duplicít nemusí byť príliš dobrý spôsob, ako to vyriešiť. 

Preto Spotibo zoskupuje (Group by icon) aj stránky podľa rovnakého canonical tagu:

Group by canonicals

Po rozkliknutí som si mohol rýchlo overiť, ako veľmi sú stránky podobné. Na URL https://www.mall.cz/listy/darky-miminka sú skanonizované napr.:

Pre porovnanie, vyzerajú takto:

Canonicals visually

Na prvý pohľad sú v ponúkaných produktoch viditeľné zmeny. V takomto prípade sú na mieste obavy, či vyhľadávače kanonizáciu prijali. Ako si s tým poradil Google, som si overil vyhľadávacími operátormi. Do Googlu som zadal príkaz, aby mi zobrazil stránky na mall.cz, ktoré obsahujú v URL „/listy/darky-miminka„:

Search by operators

 V tomto prípade sa zdá, že Google kanonizáciu prijal. Vo výsledkoch sa nenachádza parameter l[]=nas-tip, o=price ani category=

TIP: Návod ako pracovať s operátormi Googlu nájdeš na Moz.com.

Avšak, aby som mohol potvrdiť, že vyhľadávače canonical vyhodnotili správne, musel by som to overiť dôslednejšie. A aj tak nie je isté, ako to vyhľadávače vyhodnotia napr. o mesiac. Použitie canonical tagov nie je nikdy 100%-né a ak je to možné, radšej sa mu vyhýbam.

Rovnakým spôsobom by som našiel aj ďalšie skanonizované parametre. 

Vyskúšaj si aj ty analýzu duplicít na svojom webe.

Alebo pozri na ďalšie návody:

Poznámka: Účelom článku je ukážka funkcií Spotibo. Cieľom nie je poukázať na SEO prešľapy Mall.cz. Je možné, že súčasné riešenie na webe, je vzhľadom na okolnosti to najlepšie možné.