Správné metody pro odstranění listů stránek. Dvojité stránky, řešení Řešení Správná práce s dvojitými stránkami

Duplicas jsou stránky ve stejné doméně s identickým nebo velmi podobným obsahem. Nejčastěji se objevují v důsledku vlastností práce CMS, chyby v direktivech robotů.txt nebo v nastavení 301 přesměrování.

Jaké je nebezpečí čtyřhra

1. Nesprávná identifikace příslušné stránky vyhledávacího robota. Předpokládejme, že máte jednu a stejnou stránku dostupnou na dvou adresách URL:

Https://site.ru/kepki/

Https://site.ru/catalog/kepki/

Investovali jste peníze do podpory stránky https://site.ru/kepki/. Nyní se odkazuje na tematické zdroje a to zařadilo pozice v top 10. Ale v určitém okamžiku to robot eliminuje z indexu a na oplátku přidává https://site.ru/catalog/kepki/. Tato stránka je samozřejmě zařazena horší a přitahuje méně provozu.

2. Zvyšování času potřebného pro překročení místa roboty. Na skenování jednotlivých robotů webu přidělil omezený čas. Je-li spousta dvoulůžkových, robot se nemusí dostat na hlavní obsah, protože bude indexování zpožděno. Tento problém je zvláště relevantní pro stránky s tisíci stránkami.

3. překrytí sankcí vyhledávače. Duplikáty nejsou důvodem pro pesimizaci stránek - pokud hledaných algoritmů nepočítají, že vytvoříte, že se vytvoříte úmyslně s cílem manipulovat s vydáním.

4. Problémy pro webmastery. Je-li práce na odstranění čtyřhry do odložit v dlouhé krabici, mohou být akumulovány takovým množstvím, že webmaster je čistě fyzicky, bude obtížné zpracovávat zprávy, systematizovat důvody dubů a provádět úpravy. Velká práce zvyšuje riziko chyb.

Dupils jsou konvenčně rozděleny do dvou skupin: explicitní a implicitní.

Explicitní duplicas (stránka dostupná na dvou nebo více adresách URL)

Existuje mnoho možností pro takové dvoulůžkové, ale jsou všechny jako jejich podstata. Zde jsou nejčastější.

1. URL s lomítkem na konci a bez ní

Https://site.ru/list/

Https://site.ru/list.

Co dělat: Konfigurace serverová odpověď "http 301 se přesunul trvale" (301. přesměrování).

Jak to udělat:

    • najít v kořenové složce Site File.htaccess a Otevřít (pokud neexistuje - Vytvořit ve formátu txt, call.htaccess a vložte kořen stránek);
    • předepsat soubor souborů pro přesměrování s adresou URL s lomítkem na adrese URL bez lomítka:

Rewritecond% (request_filename)! -D
Rewritecond% (požadavek_uri) ^ (. +) / $
Rewriterule ^ (. +) / $ / $ 1

    • reverzní operace:

Rewritecond% (request_filename)! -F
Rewritecond% (request_uri)! (. *) / $
Rewriterule ^ (. * [^ /]) $ 1 /

    • pokud je soubor vytvořen od nuly, musí být všechny přesměrovány uvnitř takových řádků:



Konfigurace 301 Přesměrování s .htaccess je vhodný pouze pro lokality Apache. Pro nginx a další servery je přesměrování konfigurován jinými způsoby.

Jaká URL je preferována: s nebo bez slam? Čistý technicky - žádný rozdíl. Podívejte se do situace: Pokud jsou více stránek indexovány s lomítkem, opustit tuto možnost a naopak.

2. URL s www a bez www

Https://www.site.ru/1.

Https://site.ru/1.

Co dělat: Zadejte hlavní zrcadlo webu v panelu webmasteru.

Jak to udělat v Yandexu:

    • jdi na Yandex.vebmaster.
    • vyberte místo v panelu, ze kterého bude přesměrování jít (nejčastěji přesměrován na adresu URL bez WWW);
    • přejděte do sekce "Indexování / Site Stěhování", odeberte zaškrtnutí políčka před položkou "Přidat www" a uložte změny.

Během 1,5-2 týdnů Yandexu se zrcadla znovu reprezentují stránky a zobrazí se pouze URL bez WWW.

Důležité! Dříve, pro určení hlavního zrcadla v souboru Robots.txt, bylo nutné předepsat správní směrnici. Ale není to již podporováno. Některé webmastery "pro bezpečnost" stále naznačují tuto směrnici a pro ještě větší spolehlivost 301 přesměrování - to není nutné, stačí upravit lepení v webmasteru.

Jak lepit zrcátka ve společnosti Google:

    • vyberte stránku, ze kterého přesměrování půjde z vyhledávací konzoly;
    • klikněte na ikonu Převodovku v pravém horním rohu, vyberte položku "Nastavení webu" a vyberte hlavní doménu.

Stejně jako v případě Yandexu nejsou nutné další manipulace s 301 přesměrováním, i když je možné s ním realizovat lepení.

Co by mělo být provedeno:

    • vyložit seznam indexovaných adres URL od Yandex.Webmastera;
    • stáhněte si tento seznam do nástroje Seopult Seznam nebo pomocí souboru XLS (podrobné pokyny pro použití nástroje);

    • spusťte analýzu a stáhněte si výsledek.

V tomto příkladu je stránka faginace indexována Yandexem a Google není. Důvodem je, že jsou uzavřeny od indexování v robotech.txt pouze pro bot yandex. Řešení - Nastavení kanonizace pro stránky stránek.

Pomocí analyzátoru od Seopult, pochopíte, duplicitních stránek v obou vyhledávačích nebo pouze v jednom. To vám umožní zvolit optimální řešení řešení problémů.

Pokud nemáte čas nebo zkušenosti, abychom se jednali s čtyřhry, objednejte si audit - kromě dvojnásobek, který dostanete hodně užitečné informace O vašem zdroje: přítomnost chyb v HTML kódu, titulky, meta tagy, struktuře, vnitřní průchod, použitelnost, optimalizace obsahu atd. V důsledku toho budete mít připravené doporučení na vašich rukou, která bude webu více atraktivní pro návštěvníky a zvýšit jeho pozici při hledání.

Majitel nemusí mít podezření, že na svých internetových stránkách mají některé stránky kopie - nejčastěji se to stane. Stránky jsou otevřené, s jejich obsahem jsou všechny v pořádku, ale pokud vám věnujete pozornost adresy URL, pak můžete vidět, že adresy se liší ve stejném obsahu. Co to znamená? Pro živé uživatele, nic, protože se zajímají o informace o stránkách, ale bezduché vyhledávače vnímají takový fenomén zcela odlišně - pro ně je to zcela jiné stránky se stejným obsahem.

Jsou dvojité stránky škodlivé?

Pokud tedy obyčejný uživatel nemůže ani nevšimnout na přítomnost dvojitého na vašem webu, pak vyhledávače budou okamžitě určit. Jakou reakci z nich čekají? Vzhledem k tomu, že v podstatě vyhledávací roboti vidí jako různé stránky, pak obsah přestane být jedinečný. A to již negativně ovlivňuje pořadí.

Také přítomnost duplikátu eroduje referenční hmotnost, kterou se optimalizátor snažil zaměřit na cílovou stránku. Vzhledem k dvojitému, nemusí být vůbec na této stránce, že se chce pohybovat. To znamená, že účinek vnitřních překladů a externích referencí lze opakovaně snížit.

V převážné většině případů ve výskytu dvojnásobného, \u200b\u200bCMS je vinu - kvůli ne správná nastavení A nedostatek řádné pozornosti optimalizátoru je generována jasné kopie. S tím, mnoho CMS je hřích, například Joomla. Chcete-li problém vyřešit, je obtížné zvolit univerzální recept, ale můžete se pokusit použít jeden z modulů plug-iny pro odstranění kopií.

Vznik fuzzy čtyřhra, ve kterém obsah není zcela identický, obvykle dochází v důsledku poruchy webmasteru. Tyto stránky se často nacházejí na internetových stránkách online obchodu, kde jsou stránky se zbožím charakterizovány pouze několika větami s popisem a zbytek obsahu sestávající z bloků a dalších prvků je stejný.

Mnoho specialistů tvrdí, že malé množství čtyřhry nebude ublížit místo, ale pokud je více než 40-50% více než 40-50%, pak může zdroj čekat na vážné potíže. V každém případě, i když kopie nejsou tolik, stojí za to udělat s jejich odstraněním, takže jste zaručeni se zbavit problémů s dubami.

Vyhledávací stránka Kopie

Existuje několik způsobů hledání duplicitních stránek, ale nejprve byste měli kontaktovat několik vyhledávačů a zjistit, jak vidí vaše stránky - stačí porovnat počet stránek v indexu každého. To je poměrně jednoduché, aniž by se uchýlil k dalším prostředků: v Yandex nebo Google dost ve vyhledávacím řetězci, zadejte hostitele: yoursite.ru a podívejte se na počet výsledků.

Pokud po takové jednoduché kontrole bude množství velmi odlišné, 10-20 krát, pak je to s některými pravděpodobněmi, že hovoří o obsahu dubu v jednom z nich. Kopie stránek nemohou být pro takový rozdíl vinit, ale nicméně dává důvod pro další důkladnější vyhledávání. Pokud je stránka malá, můžete ručně vypočítat počet reálných stránek a porovnat s indikátory z vyhledávačů.

Vyhledávání Duplicitní stránky Můžete vyhledávat adresu URL v vydání vyhledávače. Pokud musí být CNC, pak stránky s URL nepochopitelných postav, jako "index.php? S \u003d 0F6B2903D", budou okamžitě v rozpacích z obecného seznamu.

Dalším způsobem, jak určit přítomnost duplikátu pomocí vyhledávačů je vyhledávání na textových fragmentech. Postup pro takovou kontrolu je jednoduchý: Musíte zadat textový fragment z 10-15 slov z každé stránky v řetězci vyhledávání, a poté analyzovat výsledek. Pokud budou dvě nebo více stránek v vydání, existují kopie, pokud je výsledek pouze jeden, pak na této stránce nejsou žádné čtyřhra a nemůžete se obávat.

Je logické, že pokud stránky se skládá z velkého počtu stránek, pak se taková kontrola může proměnit v neproveditelnou rutinu pro optimalizátor. Chcete-li minimalizovat časové náklady, můžete použít speciální programy. Jedním z těchto nástrojů, který je pravděpodobně známkou zkušených specialistů, je Xenu's Link Sleuth.

Chcete-li zkontrolovat stránky, musíte otevřít nový projektVýběrem v nabídce "Soubor" "Zaškrtněte adresu URL", zadejte adresu a klepněte na tlačítko "OK". Poté program začne zpracovávat veškerou adresu URL stránky. Na konci šeku musíte exportovat přijaté data na jakýkoliv pohodlný editor a začněte hledat dvojité.

Kromě výše uvedených metod v nástrojích panelů Yandex.vebmaster a Google Webmaster Tools, existují prostředky pro kontrolu stránek indexování, které lze použít k vyhledávání dvojnásobek.

Metody řešení problému

Po nalezení všech dupliků bude vyžadována jejich eliminace. To může být také provedeno několika způsoby, ale pro každý konkrétní případ potřebujete svou vlastní metodu, je možné, že každý bude muset použít.

Kopírovat stránky mohou být vymazány ručně, ale tato metoda je poměrně vhodná pouze pro ty, které byly vytvořeny ruční cesta Nekonzistentností webmasteru.

Přesměrování 301 je skvělé pro lepení stránek-kopií, jejichž url se odlišuje přítomností a nepřítomností www.

Řešení problémů s čtyřhry pomocí kanonické značky lze použít pro fuzzy kopie. Například pro kategorie zboží v internetovém obchodě, které mají duplikát, rozlišující třídění v různých parametrech. Kanonický je také vhodný pro verze stránek pro tisk a v jiných podobných případech. Používá se poměrně jednoduše - pro všechny kopie je indikován atribut rel \u003d "kanonický" a pro hlavní stránku, která je nejrelevantnější - ne. Kodex by měl vypadat něco takového: odkaz rel \u003d "kanonický" href \u003d "http://yoursite.ru/stranica-kopiya" / a stát v hlavě značky.

V boji proti čtyřhrám vám pomůže konfigurovat soubor robots.txt. Směrnice o zakázce vám umožní zavřít přístup k dubům pro vyhledávací roboty. Můžete si přečíst více o syntaxi tohoto souboru v vydání №64 našeho newsletteru.

nálezy

Pokud uživatelé vnímají duplikát jako jedna stránka s různými adresami, pak pro pavouky, to jsou různé stránky s duplicitním obsahem. Kopie stránek jsou jedním z nejčastějších úskalí, které se nemusí dostat kolem nováčků. Jejich přítomnost ve velkém množství na propagatelském místě je nepřijatelná, protože vytvářejí vážné překážky k výstupu.

Kapky stránek na stránkách nebo blogechOdkud pocházejí a jaké problémy mohou vytvářet.
Je to o tom, že budeme mluvit o tomto příspěvku, budeme se snažit vypořádat se s tímto fenoménem a najít způsoby, jak minimalizovat ty potenciální problémy, které mohou přinést duplicitní stránky na místě.

Tak bude pokračovat.

Co je duplicitní stránky?

Holandské stránky na jakémkoli webovém zdroji znamená přístup ke stejným informacím na různých adresách. Tyto stránky se také nazývají vnitřní dubové lokality.

Pokud je text na stránce zcela identický, pak se takový duplikát nazývá úplná nebo čistá. S částečnou náhodou duplikát se nazývá neúplná nebo fuzzy.

Neúplné duplikace - Jedná se o stránky kategorií, seznam stránek zboží a podobné stránky obsahující oznámení materiálů z webu.

Plně duplicitní stránky- Jedná se o verze pro tisk, stránky s různými rozšířeními, archivy stránky, hledání na webu, stránky s komentářem.

Zdroje dvojitých stránek.

Na tento moment Nejvíce balených stránek je generována kdy pomocí moderních CMS. - Systémy správy obsahu, které jsou také nazývány motory stránek.

To je I. WordPress a Joomla a DLE A další populární CMS. Tento fenomén vážně oznamuje optimalizátory stránek a webmasterů a dodává je další potíže.

V online obchodech Dupils se může objevit, když je zboží zobrazeno s třídícím na různých detailech (výrobce zboží, jmenování zboží, datum výroby, ceny atd.).

Je také třeba si pamatovat notoricky známý konzole www.a určit, zda je ve jménu domény při vytváření, rozvoji, propagaci a propagaci stránek.

Jak vidíte, zdroje vzhledu dvojité mohou být jiné, uvedl jsem pouze hlavní, ale všechny jsou odborníkům v oboru dobře známy.

Holandské stránky, negativní.

Navzdory tomu, že mnozí na vzhledu čtyřhry neplatí zvláštní pozornost, tento jev může vytvořit vážný problémy při propagaci míst.

Prohledat vyhledávač droky jako spama v důsledku toho je vážné snížit polohu těchto stránek i lokality jako celku.

Při propagaci odkazů se může vyskytnout následujícím způsobem. V určitém okamžiku je vyhledávač považován za nejvíce příslušná stránka Double.A ne ten, který podporujete odkazy a všechny vaše úsilí a náklady budou marné.

Ale lidé, kteří se snaží použít duplicitní hmotnost Na požadovaných stránkách, nejdůležitější, například nebo jiné.

Metody zabývající se stránkami Dubs

Jak se vyhnout dvojnásobné nebo jak snížit negativní okamžiky, když se objeví?
A obecně to stojí za to nějakým způsobem řešit tímto, nebo vše, aby dal milosrdenství pro vyhledávače. Nechte je demontovat, protože jsou tak chytré.

Pomocí robotů.txt.

Robots.txt.- Jedná se o soubor umístěný v kořenovém adresáři našich stránek a obsahuje směrnice pro vyhledávací roboty.

V těchto směrnicích uvádíme, které stránky na našem webu indexu a které nejsou. Můžeme také určit název hlavní domény webu a soubor obsahující mapovou stránku.

Zakázání stránek indexování použitelná směrnice Zakázat. Je to, že webmasters ji používají, aby se zavřeli od indexace duplicitních stránek a nejen duplikát, ale jakékoli další informace, které nejsou přímo spojeny s obsahem stránek. Například:

Zakázat: / Vyhledávání / - Zavřete stránky hledání stránek
Zakázat: / *? - Zavřete stránky obsahující otazník "?"
Zakázat: / 20 * - Zavřete archiv stránku

Pomocí file.htaccess.

Soubor.htaccess.(bez rozšíření) je také umístěn v kořenovém adresáři webu. K boji proti duplikátům v tomto souboru, přizpůsobit použití 301 přesměrování.
Tato metoda pomáhá udržovat indikátory webu, kdy cMS se mění nebo mění svou strukturu. Výsledkem je správný přesměrování bez ztráty referenční hmotnosti. Současně bude váha stránky na staré adrese předán na stránce na nové adrese.
301 Přesměrování Použijte a při určování hlavní domény webu - s WWW nebo bez WWW.

Použití značky REL \u003d "Cannonical"

S touto značkou, webmaster označuje vyhledávač původního zdroje, tj. Stránka, která by měla být indexována a podílet se na pořadí vyhledávačů. Stránka se nazývá kanonická. Záznam v kódu HTML bude vypadat takto:

Při použití CMS WordPress to lze provést v nastavení takové užitečné. plugin jako v jednom seo balení.

Další opatření pro boj proti čtyřhrám pro CMS WordPress

Použitím všech výše uvedených způsobů řešení duplicitních stránek na vašem blogu jsem měl pocit po celou dobu, kdy jsem ne všechny, co můžete. Proto bojuje na internetu, poradenství s profesionály, rozhodl jsem se udělat něco jiného. Teď to budu popisovat.

Rozhodl jsem se eliminovat Dupils, které jsou vytvořeny na blogu, kdy Použijte kotvy Řekl jsem jim o článku "HTML kotvy". Na blogech běží CMS WordPress kotvy jsou tvořeny při značce "#More" a při použití komentářů. Proveditelnost jejich aplikace je spíše kontroverzní, ale ducky jsou ovocně jasně.
Nyní, jak jsem tento problém odstranil.

Za prvé, vezmeme značku #more.

Našel soubor, kde je vytvořen. Důležití jsem navrhl.
Tento ../ wp-zahrnuje / post-template.php
Pak jsem našel fragment programu:

ID) "třída \u003d" více-link "\u003e $ více_link_text", $ MORE_LINK_TEXT);

Fragment označený červenou odstraněnou

#more - ($ Post-\u003e ID) \\ "Třída \u003d

A přijat v konci řetězec tohoto druhu.

$ Výstup. \u003d Apply_Filters ('the_content_more_link', ' $ More_Link_text.", $ MORE_LINK_TEXT);

Odstraňte poznámky kotvy #comment

Nyní se obrátíme na komentáře. To je již Dodumal sám.
Rovněž se určuje se souborem ../wp-includes/comment-template.php.
Najděte požadovaný fragment kódu programu

návrat Použít_filters ('get_comment_link', $ link . '# KOMENTÁŘ-'. $ Comment-\u003e comment_id, $ komentář, $ args);)

Podobně, fragment označený červený odstraněn. Velmi úhledně, opatrně, až do každého bodu.

. '# KOMENTÁŘ-'. $ Comment-\u003e comment_id

V důsledku následující řady programového kódu.

návrat Použít_filters ('get_comment_link', $ link, $ komentář, $ args);
}

Samozřejmě vše bylo provedeno, dříve zvolené zadané softwarové soubory Do počítače tak, aby v případě selhání je snadné obnovit stav ke změnám.

V důsledku těchto změn, kdy kliknete na text "Přečtěte si zbytek záznamu ..." Mám stránku s kanonickou adresou a bez přidání na adresu ocasu ve formuláři "# více- .. .. ". Také při kliknutí na komentáře mám normální kanonickou adresu bez předpony ve formě "# komentáře- ...".

Počet dvojitých stránek na místě tak mírně snížil. Ale co jiného vytvoří naše Wordpress, teď nemůžu říct. Dále budeme sledovat problém.

A v závěru přivedu k vaší pozornosti velmi dobré a informativní video na toto téma. Důrazně doporučuji vidět.

Všechny zdraví a úspěch. Až do následujících schůzek.

Užitečné materiály:

Stránky žáků - jeden z mnoha důvodů pro snížení pozic v výsledky vyhledávání A dokonce i pod filtrem. Abyste tomu zabránili, musíte je varovat do indexu vyhledávače.

Určete přítomnost dvojitého na místě a zbavte se jich různými způsoby, ale závažnost problému je, že duplikát není vždy zbytečné stránky, prostě by neměly být v indexu.

Tento problém vyřešíme nyní, jen za začátek zjistit, co je duplikát a jak vznikají.

Co je duplicitní stránky

Stránky žáků je kopií obsahu kanonické (hlavní) stránky, ale s jinou adresou URL. Je důležité si všimnout, že mohou být úplné i částečné.

Plná duplikace Je to přesná kopie, ale s jeho adresou, jehož rozdíl se může projevit v lomítko, WWW zkratce, substituce parametrů index.php?, Strana \u003d 1, strana / 1 atd.

Částečná duplikace Je projeveno v neúplném kopírování obsahu a související s strukturou webu, kdy oznámení článků adresáře, archivy, obsah z postranního panelu, stránky stránky a další přes prvky zdroje obsaženého na kanonické stránce jsou indexovány. To je vlastní ve většině CMS a online obchodů, ve kterých je katalog nedílnou součástí struktury.

Už jsme hovořili o důsledcích výskytu dubu, a to je způsobeno distribucí referenční hmoty mezi duplikáty, podněcovacími stránkami v indexu, ztráta jedinečnosti obsahu atd.

Jak najít Ducky stránky na místě

Pro vyhledávání dvojnásobek lze použít následující metody:

  • Řetězec vyhledávání Google. S designem webu: myblog.ru, kde myblog.ru je vaše adresa URL, jsou zjištěny stránky z hlavního indexu. Chcete-li vidět Dupils, musíte jít poslední strana Výsledky vyhledávání a klikněte na řádek "Zobrazit skryté výsledky";
  • tým "Rozšířené vyhledávání" v Yandexu. Ukazující ve speciální adresu okna vašich stránek a vstup do uvozovek Jedním z návrhů indexovaného článku vystaveného kontrole, musíme získat pouze jeden výsledek. Pokud je jejich další duplikát;
  • panel nástrojů Pro webmastery v PS;
  • ručně, Nahrazení B. Řádek adresy Slash, www, html, asp, php, písmena horních a nižších registrů. Ve všech případech musí nastat přesměrování na stránce s hlavní adresou;
  • speciální programy a služby: XENU, MEGAINDEX atd.

Odstraňte listy stránek

Odstranění čtyřhry má také několik. Každý z nich má jeho dopad a důsledkyProto není nutné hovořit o nejefektivnějších. Mělo by to být pamatováno fyzikální destrukce Indexovaný duplikát není cesta ven: vyhledávače o tom stále pamatují. Proto nejlepší způsob řešení dubů - zabránit jejich vzhledu Pomocí správných nastavení webu.

Zde jsou některé způsoby, jak eliminovat čtyřhry:

  • Nastavení robotů.txt.. To umožní konkrétní stránky od indexování. Ale pokud jsou roboty Yandex náchylné tento soubor, Google zachycuje i stránky uzavřené, neuvádějí zejména jeho doporučení. Kromě toho, s pomocí robotů.txt, odstranění indexovaných dupliků je velmi obtížné;
  • 301 přesměrování. Přispívá k lepení dvojnásobek s kanonickou stránkou. Metoda je platná, ale ne vždy užitečná. Nemůže být použit v případě, že duplikáty musí zůstat nezávislé stránky, ale neměly by být indexovány;
  • Přiřazení 404 chyb Infikované dubs. Metoda je velmi dobrá pro jejich odstranění, ale bude vyžadovat nějaký čas před tím, než se účinek projevuje.

Když nic lepide a odstraňovat nic, ale nechci ztratit váhu stránky a získat trest od vyhledávačů, používá se rel Canonical HREF atribut.

Rel kanonický atribut na boj proti čtyřhře

Začnu s příkladem. V internetovém obchodě jsou dvě stránky s identickými kartami obsahu, ale na stejném zboží je abecedně a na druhé straně. Oba jsou zapotřebí a přesměrování není povoleno. Ve stejné době, pro vyhledávače je to jasné dvojité.

V tomto případě racionální použití značky link Rel Canonical.Indexování kanonické stránky, která je indexována, ale hlavní stránka zůstává pro uživatele k dispozici.

To se provádí následujícím způsobem: v bloku hlavy stránek-duplikát, je uveden odkaz. "Link Rel \u003d" kanonický "href \u003d" http://site.ru/osnovnaya Stranitsa "/"kde je Stranitsa adresou kanonické stránky.

S tímto přístupem může uživatel volně navštívit libovolnou stránku webu, ale robota, čtení kódu ALL Canonical Atribut Code, bude indexovat pouze adresu, jejichž adresu je uvedena v odkazu.

Tento atribut může být užitečný a pro stránky stránek. V tomto případě vytvořte stránku "Zobrazit vše" (takový "portuglight") a bere pro kanonické a pagination stránky poslat robot k němu prostřednictvím relanical.

Tak, volba způsobu boje proti duplikaci stránek závisí na povaze jejich vznik a nutnost Přítomnost na místě.

Docela často, na stejném místě jsou kopie stránek a jeho majitel nemusí o tom hádat. Když se otevírají, vše je zobrazeno správně, ale pokud se podíváte na adresu webu, pak můžete informovat, že různé adresy mohou odpovídat stejnému obsahu.

Co to znamená? Pro jednoduché uživatele v Moskvě, nic, protože přišli na vaše stránky, aby se podívali na jména stránek, ale protože se zajímali o obsah. Ale to nelze říci o vyhledávačích, protože jsou vnímány takovou pozicí v zcela jiném světle - vidí stránky se stejným obsahem od sebe.

Pokud obyčejní uživatelé si nemohou všimnout duplikovaných stránek na webu, to určitě nebude sklouznout od pozornosti vyhledávačů. Co to může vést? Hledat roboty definují kopie jako různé stránky, v důsledku toho přestanou vnímat svůj obsah jako jedinečný. Máte-li zájem o propagaci stránek, pak víte, že na žebříčku bude určitě ovlivnit. Kromě toho, přítomnost dvojité sníží referenční hmotnost, která se objevila v důsledku značné úsilí optimalizátoru, která se snažila zvýraznit cílovou stránku. Duplikace stránek může vést k tomu, že bude zvýrazněna zcela jiná část webu. A to může občas snížit účinnost externích referencí a vnitřních překladů.

Mohou návrh stránek přinést poškození?

Viníka vzhledu dvojitého je CMS, Špatná nastavení Který nebo nedostatek pozornosti optimalizátoru může vést k generování jasných kopií. Takové systémy řízení lokalit, jako je Joomla hřích často. Okamžitě si to všimněte univerzální prostředky Chcete-li bojovat proti tomuto fenoménu, prostě neexistuje, ale můžete nastavit jeden z pluginů určených k vyhledávání a mazání kopií. Může se však objevit fuzzy duplikáty, jejichž obsah není plně shodující. Nejčastěji se děje v důsledku bezchybnosti webmasteru. Tyto stránky lze často nalézt v online obchodech, ve kterých se karty zboží liší pouze s několika popisy popisu, zbytek stejného obsahu, který se skládá z různých prvků a skrz bloků, je stejný. Odborníci se často shodují, že některé čtyřhry nebrání stránky, ale pokud existuje asi polovina nebo více asi polovina nebo více, pak podpora zdroje způsobí mnoho problémů. Ale i v případech, kdy na místě je několik kopií, je lepší je najít a eliminovat - takže se pravděpodobně zbavíte čtyřhry na váš zdroj.

Nalezení duplicitních stránek

Duplicitní stránky naleznete několika způsoby. Ale před samotným hledáním by bylo dobré se podívat na vaše stránky očima vyhledávačů: jak si ho představují. Chcete-li to provést, jednoduše porovnejte počet vašich stránek s těmi, kteří jsou v jejich indexu. Chcete-li to vidět, zadejte hledat String. Google "Yandex" fráze hostitele: yoursite.ru, po které hodnotí výsledky.

Pokud je takový jednoduchá kontrola Poskytněte různá data, která se mohou lišit v 10 nebo více časy, to znamená, že je to důvod věřit, že váš elektronický zdroj obsahuje dunk. I když se to vždy nestane kvůli chybě duplicitních stránek, ale tato kontrola bude sloužit jako dobrý základ pro jejich vyhledávání. Pokud má vaše stránky malou velikost, pak můžete nezávisle vypočítat počet reálných stránek, pak porovnat výsledek s ukazateli vyhledávače. Můžete vyhledávat duplikáty a přes adresy URL, které jsou nabízeny ve výsledcích vyhledávání. Pokud používáte CNC, pak stránky s nepochopitelnými symboly v URL, například "index.php? C \u003d 0F6B3953D", okamžitě přitahují vaši pozornost.

Další metodou určení přítomnosti dvojnásobku je vyhledat textové fragmenty. Chcete-li provést takovou kontrolu, musíte zadat text z několika slov každé stránky do vyhledávacího řetězce, pak jednoduše analyzovat výsledek. V případech, kdy dva nebo více stránek spadají do vydání, je zřejmé, že kopie probíhají. Pokud je stránka v extrahaci pouze jedna, pak nemá duplikáty. Tato zkušební metoda je samozřejmě vhodná pouze pro malé místo sestávající z několika stran. Když web obsahuje stovky z nich, jeho optimalizátor může používat speciální programy, jako je například Xenu's Link Sleuth.

Chcete-li zkontrolovat web, otevřete nový projekt a přejděte do nabídky "Soubor", vyhledejte "Zaškrtněte adresu URL", zadejte adresu webu, o které máte zájem, a klepněte na tlačítko OK. Nyní program začne zpracovávat veškerou adresu URL zadaného zdroje. Když je práce dokončena, přijatá informace budou muset otevřít v jakémkoli pohodlném editoru a hledat dvojnásobek. Na těchto metodách vyhledávání duplicitních stránek nekončí: v panelu nástrojů Webmaster a Yandex.vebmaster můžete vidět prostředky ke kontrole indexování stránek. S jejich pomocí můžete také najít duplikát.

Na cestě k vyřešení problému

Když najdete všechny duplicas, budete mít úkol odstranit je. Existuje několik možností pro řešení tohoto problému a různé metody Náprava duplicitních stránek.

Spojení kopií lze provádět pomocí přesměrování 301. To je účinné v případech, kdy se URL rozlišuje absencí nebo dostupností www. Strany kopií můžete odstranit v ručním režimu, ale tato metoda je úspěšná pouze pro ty čtyřhře, které byly vytvořeny ručně.

Problém můžete vyřešit duplikátem s kanonickou značkou, která se používá pro fuzzy kopie. Tak to může být použit v internetovém obchodě pro kategorie zboží, pro které existují duplikáty a které se liší pouze pro třídění podle různých parametrů. Kromě toho je kanonická tag vhodný pro použití na tiskových stránkách a v podobných případech. Není těžké jej použít - pro každou kopii je atribut nastaven ve formě rel \u003d "kanonické", pro postupnou stránku s nejrelevantnějšími vlastnostmi, tento atribut není zadán. Přibližný pohled na kód: odkaz rel \u003d "kanonický" href \u003d "http://site.ru/stranica-kopiya" /. Mělo by být umístěno v oblasti štítku hlavy.

Správně nakonfigurovaný soubor robots.txt bude také dosáhnout úspěchu v boji proti dubům. Pomocí směrnice o zakázce můžete překrývat přístup vyhledávacích robotů na všechny duplicitní stránky.

Dokonce i profesionální rozvoj webu nepomůže stáhnout jej v horní části, pokud zdroj obsahuje duplicitní stránky. Dnes jsou stránky - kopie jedním ze společných úskalí, ze kterých nováčci trpí. Jejich velká částka na vašich stránkách vytvoří značné potíže při jeho uvedení na vrchol, a dokonce to nemožné vůbec.