Matt Cutts: Podčiarkovníky vs. pomlčky

Update 2016: Google v súčasnej dobe dokáže rozlíšiť aj slová oddelené podčiarkovníkom.

O tom, ako Google vníma podčiarkovníky (podtržítka) a pomlčky, sa viedlo mnoho diskusií. Ako je tomu v súčasnosti a ako tomu bude do budúcna, vám už prezradí Matt:

Zhrnutie a komentár

História zostáva nezmenená a ešte to tak aj nejaký čas zostane.
Ako vníma pomlčku a podčiarkovník Google:

  • Pomlčka "-" slúží ako separátor slov. Napr. výraz "auto-mercedes" sa považuje za dve slová: auto a mercedes.
  • Podčiarkovník "_" je vnímaný ako súčasť jedného slova. Napr. výraz "auto_mercedes" sa považuje za jedno slovo "auto_mercedes".

Ako je to so Seznamom?

  • Ten vníma pomlčku aj podčiarkovník rovnako - ako separátor.

Textový prepis videa

Ahojte. Rád by som vám povedal nové informácie o podčiarkovníku "_"vs. pomlčkách "-" v URL. Na toto sa ma už pýtalo mnoho ľudí, rozprával som o tom už dávnejšie a napadlo ma, že prišiel čas na aktualizáciu.

Takže, najskôr mi dovoľte trochu histórie o tom, prečo keď si všimneme podčiarkovník, skôr ho vnímame v URL na spájanie, ako rozdeľovanie. Čo tým myslím? Nuž, keď poviete red-widget v URL, vnímame pomlčku "-" ako separátor. Takže indexujeme slová "red" a indexujeme aj slovo "widget".

A tie sú oddelené. Pokiaľ by ste mali "War of 1812" s podčiarkovníkom, teda war_of_1812 namiesto rozdelenia slova na podčiarkovníkoch, sme spojili všetko dohromady. Takže je to jedno slovo, ktoré možno nájsť hľadaním war_of_1812.

Zdá sa, že je to trochu zvláštne. Prečo to teda Google robí? Nuž, v čase keď sme začínali, AltaVista bola obrovská. My sme boli len mrňavá spoločnosť a všetci sme boli technologicky zameraní. Mnohí boli programátori. A chceli sme nájsť presne to, čo sme chceli, pokiaľ ide o slová. Boli sme pomerne precízni.

A ak ste programátor, často nad takými vecami premýšľate. Ak ste programátor v C, môžete tak rozpoznať TMP_MAX. Keď ste programátor, chcete mať možnosť nájsť takú frázu a teda nájsť TMP_MAX ako jeden konkrétny výraz. Nie sú to TMP a MAX, ktoré na nachádzajú na stránke.

Takže to bolo kvôli tomu, že pôvodní inžinieri boli programátormi. A programátori chceli mať možnosť vyhľadávať programátorské výrazy, ktoré sú založené na podčiarkovníku, skôr ako by ho vnímali ako separátor.

Momentálne pri praktických dotazoch, to nerobí tak veľký rozdieľ. Je to niečo, čo nazývame sekundárny efekt. Nie je to vec, ktorá by v skutočnosti robila obrovské rozdiely. Napríklad, na Wikipédii je veľa stránok, na ktorých je war_of_1812. To neodstrkuje Wikipédiu od hodnotení.

Pretože je tam nejaký Page Rank, nejaká proximita, je tam titulok, sú tam všetky ostatné signály, ktoré využívame, je ich cez 200. Ale ak sa chystáte vytvoriť web a začínate nanovo, máte voľný priestor, ako s tým začať pracovať. Ja by som asi zvolil pomlčky.

A pokračoval by som s nimi prinajmenšom aj v dohľadnej budúcnosti. Pred pár rokmi sme premýšľali, že rozdelíme aj podčiarkovníky. Ale ukázalo sa, že dopad na naše hodnotenie bude relatívne malý. A ukázalo sa, že inžinieri, v porovnaní s inými projektmi, mali k dispozícii prioritnejšie veci, na ktorých sme ich nechali pracovať.

Takže aspoň v súčasnej dobe, stále spájame pomocou podčiarkovníku a rozdeľujeme pomocou pomlčky. Čiže ako sa pýtalo zopár ľudí, či premýšľame nad rozdeľovaním u podčiarkovníku a či to tak robíme? Odpoveď je nie. A neviem kedy to tak budeme robiť. Nikto na tom nepracuje. Takže aspoň v súčasnosti, je lepšie držať sa pomlčky.

Ak už máte web a používate podčiarkovníky a funguje to tak ako chcete, nevracajte sa spät a neprepisujte každú URL. Zaoberajte sa tým, len ak sa jedná o úplne nový web, kedy naozaj pracujete na niečom novom. Keď si vravíte, OK, môžem to bez problémov urobiť tak ako chcem, nastal vhodný čas používať pomlčky.

Ak už ste si dávnejšie zvolili a používate podčiarkovníky, netreba sa tým bližšie zaoberať. Nie je to významný faktor. Len som chcel v prvom rade vysvetliť niečo o dôvodoch, prečo to tak robíme, uviesť vás trochu do kontextu a povedať ako sa teraz veci majú. Takže dúfam, že je to o niečo lepšie vysvetlené. Ďakujem vám.

7 rokov skúseností do vášho e-mailu

Viem, čo obnáša SEO pre e-shop, aj spravodajstvo s miliónovou návštevnosťou. Prihláste sa do newslettra v angličtine, kde posielam články, ktoré publikujeme s tímom na blogu SEO nástroja Spotibo.

Posielam stručné informácie o nových článkoch a novinkách. Žiadny spam. Odber môžete kedykoľvek zrušiť.

4 komentáre

  1. O tomto jsem taky na blogu psal. Měl jsem v plánu udělat blogposty s překlady na všechna videa od Matta, potom ale Youtube spustil české titulky, tak jsem to odložil.
    Jak jsi dopadl s „propagováním“ slovenských titulků pro tato videa?

    Odpovedať
  2. Niektorým videám boli pridané české titulky? Alebo máš na mysli automatický preklad? Ja som si zatiaľ všimol len anglické, občas nemecké či ruské titulky, iné titulky som takmer nevidel.
    Čo pls konkrétne myslíš tou „propagáciou“?

    Odpovedať
  3. Myslel jsem ten automatický překlad, který se dá zapnout „tlačítekem CC“ na ovládacím panelu videa.
    Tou „propagací“ jsem myslel tvoji snahu se zapojit do překladu videí. Koukal jsem se, že ses na to ptal na Google Fóru a Matta na Twitteru.

    Odpovedať
  4. No, ten automatický preklad mi prišiel nedostatočný, aspoň čo týka slovenského, český som neskúšal.

    Ešte som sa pýtal aj priamo pod jedným z videí a bohužiaľ bez odpovede. To ma trochu mrzí, že je veľmi ťažké získať odpoveď na také otázky. Tak som video „na drzovku“ preložil na inom YT kanále a dal ho k originálu ako videoodpoveď. No aj to je zatiaľ bez spätnej väzby. Ešte som premýšľal, že napíšem Mikovi Shakinovi (http://mikeshakin.com), ktorý pre nich vytváral ruské titulky. Možno by dal k dispozícii kontakt na tú „správnu osobu“.

    Odpovedať

Napísať odpoveď pre Ján Januška Zrušiť odpoveď

Vaša e-mailová adresa nebude zverejnená.