V predchádzajúcom návode som ukazoval, ako nájsť na webe duplicitné obrázky.
Bolo to jednoduché. Obrázky si stačí zoskupiť podľa duplicít s funkciou .
Podobne to platí aj pre HTML stránky. So Spotibo môžeš ľahko odhaliť:
Ako odhaliť duplicity ti ukážem na konkrétnom príklade eshopu Mall.cz. Na získanie prehľadu duplicitných stránok mi stačili 3 kliknutia.
Analýza duplicitného obsahu
Na Mall.cz našlo desiatky tisíc duplicít. Avšak to neznamená, že všetko sú chyby. Duplicity môžu byť ošetrené napríklad týmito spôsobmi:
- Zakázať stránku v robots.txt.
- Nastaviť stránke noindex.
- Korektne definovať canonical tag.
Aby som videl len problémové duplicity, pomocou filtra som vyradil stránky so zákazom indexácie a robots.txt. Na začiatok som vyradil aj stránky s canonicalom. Výsledok vyzerá nasledovne:
Duplicít je zrazu oveľa menej. Ak sa na URL pozrieme bližšie, opakuje sa v nich parameter „b%5B%5D„:
- https://www.mall.cz/parfemy-darkove-sady?b%5B%5D=yvessaintlaurent
- https://www.mall.cz/parfemy-darkove-sady?b%5B%5D=salvatoreferragamo
- https://www.mall.cz/parfemy-darkove-sady?b%5B%5D=jeanpaulgaultier
Tento typ duplicít by bolo potrebné opraviť. To je prvý problém.
Aby sa mi vo výsledkoch už tento problém neopakoval, vylúčil som problémové URL týmto filtrom:
Duplicít je zasa menej:
Pozri sa na screenshot vyššie. Čo majú URL spoločné?
Duplicity vznikajú v slovníku pojmov. Rovnaký výraz je raz pomenovaný ako
- term=Korekce+expozice,
- potom ako term=exposure_correction
- a nakoniec ako term=EXPOSURE_CORRECTION.
To je ďalší problém, ktorý by mal byť vyriešený. Aby som videl ďalšie typy duplicít, filtrom vyradím aj tento parameter:
A výsledok? Zostali už len dva prípady duplicít. To je pre rozsiahly web zanedbateľné množstvo a nemá zmysel sa tým ďalej zaoberať.
Zhrňme si to. Najskôr to vyzeralo, že je na Mall.cz obrovské množstvo duplicít. Bolo to len zdanie. Keď som vyradil stránky so zakázanou indexáciou a skanonizované URL, počet neošetrených duplicít výrazne klesol. Duplicity vznikajú len na URL, ktoré:
- majú parameter b%5B%5D=
- a v slovníku pojmov, pri použití parametra term=
Ako sa zbaviť duplicít?
Uvediem len jedno riešenie. To najefektívnejšie:
- Vyberiem si z duplicít jednu hlavnú stránku, ktorú chcem vo výsledkoch vyhľadávania zobrazovať. A tie ostatné na ňu presmerujem stavovým kódom 301. Hlavnou stránkou môže byť napr. https://www.mall.cz/slovnik-pojmu/detail?term=Korekce+expozice. Duplicity (term=exposure_correction, term=EXPOSURE_CORRECTION) by som na ňu presmeroval kódom 301.
- Na stránkach, ktoré odkazujú na duplicitity, by mali byť odkazy upravené tak, aby viedli priamo na hlavnú stránku.
To je všetko. Ďalším riešením môže byť použitie canonical tagu. Avšak ako uvidíš ďalej, nie je na 100% spoľahlivé.
Analýza canonical tagov
URL uvedená v canonical tagu nemusí byť nevyhnutne duplicitná. Môže sa tam nachádzať URL s úplne iným obsahom. Takže zoskupenie podľa duplicít nemusí byť príliš dobrý spôsob, ako to vyriešiť.
Preto Spotibo zoskupuje () aj stránky podľa rovnakého canonical tagu:
Po rozkliknutí som si mohol rýchlo overiť, ako veľmi sú stránky podobné. Na URL https://www.mall.cz/listy/darky-miminka sú skanonizované napr.:
- https://www.mall.cz/listy/darky-miminka?l[]=nas-tip (parameter l[]=nas-tip)
- https://www.mall.cz/listy/darky-miminka?o=price (parameter o=price)
- https://www.mall.cz/listy/darky-miminka?category=NJ039 (parameter category=)
Pre porovnanie, vyzerajú takto:
Na prvý pohľad sú v ponúkaných produktoch viditeľné zmeny. V takomto prípade sú na mieste obavy, či vyhľadávače kanonizáciu prijali. Ako si s tým poradil Google, som si overil vyhľadávacími operátormi. Do Googlu som zadal príkaz, aby mi zobrazil stránky na mall.cz, ktoré obsahujú v URL „/listy/darky-miminka„:
V tomto prípade sa zdá, že Google kanonizáciu prijal. Vo výsledkoch sa nenachádza parameter l[]=nas-tip, o=price ani category=.
TIP: Návod ako pracovať s operátormi Googlu nájdeš na Moz.com.
Avšak, aby som mohol potvrdiť, že vyhľadávače canonical vyhodnotili správne, musel by som to overiť dôslednejšie. A aj tak nie je isté, ako to vyhľadávače vyhodnotia napr. o mesiac. Použitie canonical tagov nie je nikdy 100%-né a ak je to možné, radšej sa mu vyhýbam.
Rovnakým spôsobom by som našiel aj ďalšie skanonizované parametre.
Vyskúšaj si aj ty analýzu duplicít na svojom webe.
Alebo pozri na ďalšie návody:
Poznámka: Účelom článku je ukážka funkcií Spotibo. Cieľom nie je poukázať na SEO prešľapy Mall.cz. Je možné, že súčasné riešenie na webe, je vzhľadom na okolnosti to najlepšie možné.