Всем привет! Как известно, дубли страниц оказывают негативное влияние с точки зрения поисковой оптимизации. Например, когда на один и тот же материал можно попасть по разным адресам. Такое случается, когда контент располагается в нескольких разделах сайта сразу. Получается, что в индекс поисковиков могут попасть несколько адресов с одинаковым содержимым. Как избежать этой проблемы? Использовать тег rel=canonical на страницах дублей!
Что такое атрибут rel=canonical и канонический URL
Дубли могут сильно помешать продвижению вашего сайта. Бывает, что внешние ссылки вы закупаете на одну страницу, а в поиск попадает совсем другая. Соответственно, эффект от покупки внешних ссылок полностью или частично теряется. Чтобы этого избежать, следует использовать rel=canonical.
Тег rel=canonical используется для указания наиболее приоритетной страницы. Вернее, это даже не тег, а атрибут тега link. Указывается он в HTML-коде дублей, в последующем передавая весь ссылочный вес по приоритетному, каноническому веб-адресу.
Канонический адрес или URL страницы — это и есть тот самый «главный» адрес. Явно указав его на страницах дублей, вы с высокой вероятностью обеспечите попадание в индекс ПС именно канонической страницы, исключив дублирование.
Выглядит rel=canonical примерно так:
1 |
<link rel="canonical" href="http://site.ru/kanonicheskiy-adres"/> |
Как выбрать канонический адрес
Если вы создали материал, который доступен по нескольким ссылкам сразу, следует выявить копии и указать в коде этих страниц канонический URL. Но как определить «главный» из этих адресов?
- В первую очередь, проверьте, какие из ссылок уже находятся в индексе. Если в индексе только один адрес, его и нужно взять как канонический, прописав rel=canonical
- Если же в индексе оказались несколько URL, имеет смысл выбрать тот, на который уже есть входящие ссылки. Если входящих ссылок нет, стоит выбрать ссылку с наименьшим уровнем вложенности
Почему появляются дубли?
Страницы-копии зачастую появляются на сайтах под управлением CMS. Причём практически каждая из них так или иначе приводит к этой проблеме. Рассмотрим на примере моего любимого WordPress наиболее частые причины.
- Статья расположена в нескольких рубриках одновременно.
Скорее всего, это и есть самая распространённая причина. Проблема заключается в формировании ЧПУ. Таким образом, если я отнесу эту статью к категориям «Оптимизация и продвижение сайта» и «Полезное» , на неё будут вести 2 ссылки:dmivk.ru/saytostroenie/optimizaciya-i-prodvizhenie-sajta/atribut-relcanonical-kanonicheskij-adres-stranicy-i-dlya-chego-on-nuzhen
dmivk.ru/saytostroenie/poleznoe/atribut-relcanonical-kanonicheskij-adres-stranicy-i-dlya-chego-on-nuzhen
Поисковые системы расценят эти ссылки как абсолютно разные материалы. То же самое происходит и, например, с товарами в разных категориях.
- Теги more и replytocom.
В WordPress тег в виде #more-333 присваивается материалам, имеющим «укороченную» версию. Добавляется он в конце адреса и также может рассматриваться поисковиками как отдельная страница. То же самое происходит и с ответами на комментарии, только вместо more добавляется replytocom. В WordPress эта проблема решается автоматически с помощью плагина, о чём я расскажу далее.
Rel=canonical в WordPress
WordPress облегчит вам работу с этим атрибутом с помощью SEO-плагинов. Большинство таких плагинов автоматически прописывают канонический адрес с помощью rel=canonical. Я использую Yoast SEO и никогда даже не задумывался об указании канонических URL. Плагин делает всё за меня. Таким образом, в индекс попадает только один адрес — канонический.
Маленькое замечание
Как вы уже заметили, УРЛ страниц на моём блоге получаются довольно длинными, поэтому советую вам всё же убирать названия категорий из URL как при использовании WordPress, так и в остальных случаях.
Я бы тоже с радостью использовал бы ваш метод, но это теперь не возможно так как происходит перенаправление на первую категорию, соответственно указывать каноническую страницу бесполезно, или я чего то не понимаю?..
Вы указываете каноническую страницу вручную при редактировании материала? Или у вас URL формируется автоматически с помощью какой-то переменной?
Плагин Yoast SEO, который я использую, указывает канонический адрес автоматически