Poslední dobou se nějak moc množí dotazy ohledně indexace google. Na rozdíl od seznamu sice google nepožaduje žádnou přehnanou pozornost a je schopný zaregistrovat prakticky cokoliv, ale pak si to pěkně vynahradí při penalizaci. Občas mám až dojem, že každá stránka začíná se 100 body a google postupně ubírá body, podle toho co se mu nelíbí. Samozřejmě je to daleko složitější, ale není na škodu si připomenout naprosté základy.
Zaindexování
Google doporučuje následující tři kroky
- Odešlete je společnosti Google na adrese http://www.google.cz/addurl.html.
- Pomocí Nástrojů pro webmastery Google odešlete soubor Sitemap. Společnost Google použije soubor Sitemap ke zjištění struktury a zvýšení pokrytí vašich stránek.
- Informujte o aktivaci webu všechny stránky, které by o něm měly vědět.
Takže si to pěkně shrneme.
Bod číslo jedna doporučuje klasicky přidat URL, přes formulář. Formulář je jednoduchý. Doporučuje se využívat jej hlavně u úplně nových projektů, kdy nepočítáte že na něj hned bude směřovat velké množství zpětných odkazů. Ačkoliv google většinu stránek indexuje jen na základě odkazu, je dobré využít tento formulář pro různé jazykové mutace webu. Zvláště pokud je každému jazyku vyčleněna jiná subdoména. Př: en.našefirma.cz, sk.našefirma.cz atd. Google si jazykem webu nemusí být úplně jistý, pokud je zvoleno neutrální kódování (UTF-8). Většinou se u překladů používá stejný design jako u originálu a ten si sebou bere často i nepřeložené části (meta tagy, smluvní podmínky atd.). Jednotlivé jazykové mutace submitujte vždy do patřičné národní verze google (google.de – Německo, google.sk – Slovensko).
Bod číslo dvě je v současnosti mocná zbraň. Google Webmaster Tools totiž neslouží jen k nastavení webu, ale také se pomocí něj dá velice dobře optimalizovat. Zjistíte jak se pohybujete v google na všechna možná i nemožná slovní spojení, kolik lidí odebírá který RSS kanál, nebo vás upozorní i na bezpečnostní mezery vašeho systému. Nedávno mi poslal google prostřednictvím GWT zprávu ať si urychleně aktualizuju WordPress, protože se mu zdá, že používám starou verzi (podle meta tagu generator) a ta má bezpečnostní díru. Prostřednictvím GWT se dá také dovolat o pomoc v případě penalizací. Prostě pokud to s jakýmkoliv webem myslíte vážně přidejte si jej do GWT účtu.
Bod číslo tři je jen výzva k linkbuildingu. Pokud rozjíždíte nový zajímavý projekt, který může být užitečný nebojte se rozeslat tématickým portálům/blogům tiskovou zprávu. Mě jich chodí do měsíce několik a často z nich čerpám náměty pro články.
Pokyny týkající se návrhu a obsahu
Tyto pokyny si projdeme postupně.
Vytvořte stránku s přehlednou hierarchií a textovými odkazy. Každá stránka by měla být dostupná alespoň z jednoho statického textového odkazu.
Tento bod je tu spíše z historického hlediska. Pravdou ale je, že i dnes existují stránky z kterých nikam nevede nikam žádný odkaz. Prostě jakási černá díra, kde se naprosto ztrácí všechen link juice. Dříve tento problém způsobovali hlavně nofollow odkazy a stránky v iframe. Zapamatujte si, že na každé stránce by mělo být klikatelné alespoň logo projektu, které vede na homepage.
Nabídněte uživatelům mapu stránek s odkazy na důležité části webu. Pokud mapa stránek obsahuje více než přibližně 100 odkazů, raději ji rozdělte na více samostatných stránek.
Mapu stránek by měl mít každý velký projekt. Jedná se hiearchii stránek. Limit 100 odkazů na stránku je odkaz na jedno z pravidel, kterým se chrání google před linkfarmami. Stránka z více jak 100 odkazy jsou pro google nedůvěryhodné a dochází u nich často k problémům s přenosem link juice. Pozor hlavně na stránky využívající rozbalovací menu a příliš masivní shluky štítků u WP.
Vytvořte užitečný a informačně bohatý web a vytvořte stránky, které jasně a přesně popíší váš obsah.
Věčné prokletí eshopů. Google zbožňuje spousty textů a intextové odkazy, které odkazují na detailnější popis. Jestli chcete být zadobře s googlem snažte se psát jednoduché a výstižné texty. Jednou jsem experimentoval s googlem a zjistil jsem, že minisites, kde je text jak pro blbce mají lepší umístení než minisites s odborným textem. Jeden člověk z namepros mi řekl, že google preferuje texty, které se snadno “chápou” a lze je automaticky co možná nejlépe překládat pomocí google translatoru. No nevím co je na tom pravdy, ale faktem je, že unikátním jednoduchým textem u google rozhodně nic nezkazíte.
Uvažujte nad tím, která slova by uživatelé zadali, kdyby chtěli vaše stránky najít, a používejte je.
Google i seznam rádi servírují hledajícím lidem, přesně to co zadali. Když někdo tedy hledá Jaký robertek má nejmenší spotřebu, tak se oba budou snažit nejdříve najít nějakou stránku která pojednává právě o tomto tématu (title, url, h1, strong) a pak teprve stránky které obsahují vybrané slova. Vyhledávače to nemají u dlouhých slovních spojení jednoduché. Často se snaží pro ulehčení minimalizovat vliv příslovce, předložky,
spojky, částice a citoslovce. Jenomže pak často z hledané fráze toho moc nezůstane a výsledky jsou řekněme zavádějící. F.A.Q. (Frequently asked questions – často kladené otázky) jsou tak dneska pro většinu stránek naprosto nezbytností a netřeba je podceňovat.
K zobrazení důležitých názvů, obsahu nebo odkazů zkuste místo obrázků použít text. Prohledávač Google nedokáže rozpoznat text uvnitř obrázků. Pokud musíte pro textový obsah použít obrázky, zvažte použití atributu ALT s několika slovy popisného textu.
Ačkoliv to už dneska není tak úplně pravda, stále má google s popisem obrázků často problém. Dokáže sice už identifikovat nápisy, loga či dokonce významné lidi (alespoň se to říká) na obrázcích, ale pro různé nákresy či vzorce se velice vyplatí popisovat alt tagy a opravdu jimi nešetřete. Jestli někdo totiž hledá slovní spojení nákres keyword, obrázek keyword, fotka keyword atd., tak se google snaží člověka nejdříve dostat na jeho image search a když vidí, že mu není pomoci tak stejně bude servírovat stránky kde se vyskytuje nějaký obrázek, který buď má alt tag, anebo už jednou byl ocejchován. Schválně si to zkuste. Tohle platí i pro ostatní multimédia.
Zkontrolujte, zda jsou všechny značky title a atributy alt přesné a výstižné.
Title je u google základ. O altech už sem psal výše.
Zkontrolujte, zda jsou odkazy funkční a zda kód HTML neobsahuje chyby.
Google sice umí zpracovat kdejaký prasokód, ale hlavně chybějící tagy mohou vést k velkým problémům. Nezapomeňte že například více H1 už je také považováno za chybu. Nemusíte se sice řídit standardy W3C a klidně rvát do XHTML table tagy, ale je třeba si uvědomit, že některé tagy, které se nedoporučují používat (například iframe), mohou ztížit pochopení stránky robotem. V každém případě se vyplatí sledovat GWT a chyby v procházení. Některé upozornění opravdu stojí za to.
Používáte-li dynamické stránky (tj. obsahuje-li adresa URL znak ,,?” ), uvědomte si, že roboti některých vyhledávačů procházejí pouze statické stránky a dynamické nikoliv. Většinou pomůže, když budete používat jen několik krátkých parametrů.
Dnes se používá friendly SEO URL, které přidává celkem slušně body. Na parametry je třeba dát si pozor z jiného důvodu. Nejen google totiž zkouší posílat různé běžné hodnoty těchto parametrů a to včetně hesel. Takže hacked by google je sice poměrně rozšířený vtip, ale až bude obsah vašeho tajného fóra zaindexován na google tak se nedivte. Ostatně google už takhle hacknul i lokální web ČSSD.
Nepřekračujte rozumný počet odkazů na stránce (100).
Už jsem o tom psal výše. Google měl kdysi velký problém s linkfarmami. Je dobré si spočítat kolik máte na stránce odkazů.
Projděte si naše pokyny pro obrázky. Naleznete v nich doporučené postupy při publikování obrázků.
Pokyny naleznete kompletně tady. Doporučuju přečíst. Zajimavé je hlavně nabádání ať používáte co možná nejkvalitnější fotografie.
Tak pro dnešek to stačilo. Článek má samozřejmě pokračování, které vyjde 30.5.
- StockPhotos.cz - Obrázky pro pěkné webstránky a jiné projekty.
Použití GWT považuji pro začátek za absolutní nutnost. Zabere to jenom pár minut a nový web to pomůže nastartovat. GWT používám pro všechny, i miniaturní weby. To stejné platí i o submitnutí webu do vyhledávání v Seznamu. Řada začínajících webmasterů to podceňuje a na webtrhu potom stále dokola hledají odpověď proč jim Google neindexuje web.
No GWT jsem donedávna nepoužíval vůbec a ani tak jsem si nemohl stěžovat.. Teď ho strčím v podstatě jen tam, kde to s indexací vázne, nebo se nemůžu dočkat, případně se objevil nějaký problém. Statistiky co tam teď jsou (počet zobrazení při vyhledávání a počet kliknutí) vůbec neodpovídají údajům z GA a jsou více méně pro kočku. Všechny weby bych tam určitě nestrkal, už proto aby nebylo na první pohled zřejmé že mají stejného majitele.
Berlin: google ví kdo je majitel domény (sleduje whois), dále kontroluje které domény jsou spolu na serveru. Ostatně takto dělá i seznam.
Nemám všechny domény na sebe, používám víc hostingů, stejně tak neplácám všude GA.
Drago: google ale neví kdo je skutečným majitelem, web si třeba SK doméne, které vlastní Češi. Většinou je mají registrované pod globálním registrátorem. Už z tohoto důvodu tomu nemůže přikládat velkou váhu…
Hezký članek, díky za tipy. Chci se zeptat ohledně těch 100 odkazů na stránce. Týká se to pouze odkazů které jdou mimo doménuu na “cizí” stránky, nebo se to týká i odkazů v rámci vlastní domény např. na subdomény či kategorie webu. Pokud si např. ve wordpressu dam na web tagy, kategorie, archiv atd. jak máš na 404m.com tak budu mít hned něco přes 150 odkazů.
Díky za objasnění 🙂
lukas: 100 odkazů je doporučení. Přeci jen pokud je na stránce 100 jakýchkoliv odkazů, tak asi orientace na stránce nebude jednoduchá. Když se stránka zaběhne tak by jsem řekl, že to google zas tak vadit nebude. Navíc spousta větších stránek, kde jsou seznamy rozdělené na písmena (alba, cheaty, zboží od výrobce) by se nikdy nedala indexovat. Vezmi si třeba některé stránky na wikipedii (seznam hudebních skupin třeba 80tých let). Podle mě je to jen otázka indexování. Jakmile se jedná o zaběhnutou stránku, která postupem času prostě roste tak to zas tak vadit nebude. I když pak je opravdu na zamyšlení jestli lidé opravdu takový velký počet odkazů potřebují (třeba na 404m.com jsem si procházel kolik lidi na co klikají a třeba ten archiv nebo mrak štítků lidé moc nevyužívají).
Díky za článek. Jak zjistím jestli má moje stránka ban a za co? Díky za odpověď.
ankerek: tak za co se nedozvíš, spíše můžeš odhadnout. Ban poznáš tak že vypadneš z indexu. Nenajdeš se ani na site:domena.tld. Penalizaci tak že se posuneš dozadu. O kolik míst to je spíše otázkou jak velká je konkurence. Podle H1 prý propad o 10 míst dozadu znamená penalizaci, ale to by mohlo platit u webů co mají historii. Nové weby skáčou poměrně dost.