Orientačný počet zaindexovaných stránok zístíte, ak do vyhľadávača zadáte "site:domena.tld". Tým som možnosti Seznamu vyčerpal. Presnejšie čísla z Google dostanete vo Webmaster Tools (GWT).
Ale akú informáciu nám počet zaindexovaných stránok prinesie? Môžem si povedať, že je to veľa alebo málo a NIEKDE je problém. Alebo to približne zodpovedá skutočnému počtu stránok a MOŽNO je to v poriadku. A možno ani nie:
Ako zistiť, koľko dôležitých stránok je v indexe
Do GWT stačí nahrať sitemapu a je to:
- Do sitemapy uveďte všetky URL, ktoré chcete mať zaindexované.
- Sitemapu nahrajte do GWT (sekcia Crawl » Sitemaps).
- Počkajte niekoľko dní, než to Google spracuje.
Výsledkom bude graf s pomerom celkového počtu stránok vs. počtu zaindexovaných stránok:
Ak bude sitemap obsahovať chybné alebo presmerované URL (vracajúce stavový kód 301, 302), nezapočíta ich medzi zaindexované. Dávajte si pozor hlavne na zlé uvedenie verzie s (bez) www a na existenciu (absenciu) lomítka na konci URL.
Vďaka odoslaniu sitemapy už vieme, koľko dôležitých stránok chýba v indexe. Ale stále nevieme, ktoré typy stránok majú problémy a ako veľmi sú dôležité. Ak nie je zaindexovaná kategória s obrovskou hľadanosťou, je to oveľa väčší prúser, než stránka produktu, o ktorý je mizivý záujem. Presnejšie informácie zistíme, ak sitemapu rozdelíme na viac častí.
Segmentácia sitemapy podľa typových stránok
Do GWT je možné nahrať viac sitemáp. Takže ak urobíte sitemapu len pre stránky kategórií, uvidíte počet zaindexovaných kategórií. Odporúčam vytvoriť sitemapu pre každú typovú stránku. Aby ste nemuseli nahrávať sitemapy po jednej, môžete ich zlúčiť do sitemap indexu. To je XML súbor, ktorý obsahuje zoznam sitemáp. Výsledok bude vyzerať asi takto:
Pre e-shop je vhodnejšie iné rozdelenie než pre magazín. Vybraný spôsob závisí aj na počte stránok. Čím rozsiahlejší web, tým podrobnejšia segmentácia sa oplatí urobiť. Možností je veľa, napríklad:
E-shop
- Hlavné stránky (úvodná stránka, kontakt, pobočky,...)
- Kategórie
- Produkty
- TOP produkty
- Vyradené produkty
- Články (návody, poradca v nákupe,...)
- Ostatné (vop, info o reklamácii,...)
Väčšiemu e-shopu sa oplatí produkty rozdeliť ešte podľa kategórií (elektro, hračky, knihy,...), prípadne podľa filtrov.
Magazín
- Hlavné stránky (úvodná stránka,...)
- Kategórie
- Tagy
- Články
- Autori
- Fórum
Rozsiahle portály môžu segmentovať články aj podľa roku vydania. Potom bude vidieť prípadný problém s indexáciou archivovaných článkov.
Firemný web
Ak sa na firemnom webe nachádza pár desiatok stránok, sitemapa je zbytočná. Jej rozdelenie už tým duplom.
Keď bude mať nejaký typ stránok problém s indexáciou, s uvedeným návodom to zistíte. Avšak stále nebudete poznať konkrétne URL, ktoré majú problém. No aj toto sa dá vyriešiť.
Ktoré stránky (nie) sú v indexe?
Postup a nástroj, ako monitorovať indexáciu až 1 000 stránok, nájdete tu.