Канонические URL'ы

Случайно совпало чуть-чуть свободного времени и нужный url в Google и решил разобраться с каноническими урлами вообще и на своём сайте в частности.

Что такое canonical url и с чем его едят? Основное назначение сказать поисковикам какая из версий одинаковых или почти одинаковых страниц является главной и собрать все дубликаты в кучу.

Для примера возьмём мой сайт. У главной страницы может быть довольно приличная куча адресов: /, /ru и /ru/. Плюс на это ещё накладывается сверху модуль вывода постраничных новостей и имеем ещё два адреса: /ru/1 и /ru/1/. (Страницы без завершающего слэша моя система сама не генерит - они появляются только во внешних ссылках.)

Теперь попытаюсь избавить поисковик от мучительного выбора что-же из всей этой солянки является самой главной страницей и соберу Google PageRank в одну кучу - его у меня и так не очень много.

Для этого в <head> страницы прописывается следующий код:

<link rel="canonical" href="/" /> 

И теперь все вышеперечисленные адреса со всем своим рейтингом поисковики теоретически должны собрать в одну кучу. Осталось подождать и посмотреть чего поисковики на индексируют через некоторое время.

Естественно в моей CMS всё это дело пришлось автоматизировать, так как для полтыщи страниц (по версии Яндекса) руками вбивать замаешься. Канонические урлы для страниц с подключаемыми модулями оставляю на совести модулей. Пришлось слегка помаяться с поддержкой многоязычности, особенно для главных страниц, но вроде всё завелось и работает.

Гугл так-же разрешает использовать кроссдоменные канонические url'ы (пост в блоге на английском).

Желающие могут почитать оригинальный пост в гугло-блоге (на английском).

Теоретически всё это можно провернуть и через 301-й редирект, но нет 100%-й уверенности, что его удастся всегда корректно обеспечить, особенно из подключаемых модулей, и вдруг на сайте не появятся мёртвые души, на которые нельзя попасть.

Добавлено:

В конце мая 2011 Яндес добавил поддержку канонических ссылок. Из ограничений походу только отсутсвие кроссдоменных канонических урлов. Плюс непонятен формат в котором нужно его указывать: всегда полный с http или достаточно абсолютного от корня сайта. Источник.

Тэги:

canonical url CMS Google PageRank SEO
RSSAdd to Google

Обсуждение:

  • Автор: (Анонимус)
  • Тема: SEO
  • Супер конечно но могло-быть и получше в смысле предоставления побольше информации.И в более доступной форме,вобще хороший у тебя сайт мне очень нравится много полезной информации и разной,не надоедает.

  • Отправлено:
  • Автор: (Анонимус)
  • Тема: SEO
  • Что бы быть специалистом SEO что нужно знать? можно ли быть самоучкой?Сейчас много где востребовано,в мелких городах вобще низнают что это такое.как раз я из такого города.

  • Отправлено:
  • Автор: Dmitrii Varvashenia
  • Спасибки :)

    Я свой сайт использую в основном как записную книжку - записываю самое основное чтобы было понятно где искать информацию потом.
    Подробно расписываю только что-то очень новое для меня -- очень способствует пониманию материала в первую очередь для меня. Ну и плюс народ иногда пишет коменты, что тоже очень полезно.

    По поводу seo: специально на seo особо нигде не готовят и все в этой отрасли самоучки. Некоторые с большим опытом, некоторые с меньшим. Хотя я себе нашёл SEO-курсы и с мая собираюсь их посетить. Но у меня ощущение, что самым полезным там будут личные контакты, которые я там встречу.

    Для начала советую почитать материалы для вебмастеров от первоисточников - начните с рекомендаций гугла и яндекса.

  • Отправлено:
  • Автор: (Анонимус)
  • Тема: Эти ссылки (канонические) полный бред.
  • Прочитал ваш пост так и не понял что это такое и зачем это нужно :-) Вы меня простите но давайте по шагам:
    - Открываем исходный код например моего сайта (движок вордпрес). Думаю, что на вашем так же. Смотрим слово canonical и видим что урл показывает страницу на которой сейчас мы находимся! Ставим All in seo pack (могу допустить ошибку в названии) видим ту же картину! Спрашивается, зачем указывать урл той страницы на которой мы сейчас и так присутствуем?! Другой вопрос ... Зачем делать какие то УРЛ когда есть карта сайта?! Вот например на моем сайте гугл бот такое вытворяет!!! Такое ощущение, что он с катушек сьехал. Есть карта сайта, ходи, индексируй и ложи в свою базу. Так нет же, он что только в поисковике не напишет. Спрашивается зачем гугл боту поисковик перебирать? Тем более эти канонические ссылки ему нужны как зайцу стоп сигнал! А если эта ссылка указывает на текущую страницу , тем более с нее проку нет. Так вот до сих пор не понятна вся правда о канонических ссылках. Может какой нибудь наркоша в америке брякнул с бадуна, а толпа как обычно подхватила? Вот открыл исходный текст вашей страницы и вижу: /seo/canonical_url/. Спрашивается ЗАЧЕМ писать ссылку если она и так есть?! :-) Если Вы говорите о слеше, то по моему это полная чушь. Заканчивающий слеш не меняет ссылку. В общем сколько не хожу по блогам все говорят одно и тоже при этом логика сказанного отсутствует полностью! Будто эту канонику действительно какой то маразматик придумал. А если гуглу или какой то другой системе захочется сверять страницы (искать одинаковые), то пусть сверяет и пусть ищет! Это должна быть головная боль пустоголового поисковика, а не веб мастера. Вы простите меня за столь резкие высказывания, просто уже неделю ищу вразумительное разьяснение, а найти не получается ...

    Искренне желаю удачи вашему блогу.
  • Отправлено:
  • Автор: Dmitrii Varvashenia
  • По поводу canonical на каждой странице, в том числе и на странице с правильным адресом - это делается из-за упрощения жизни программистам - пропадает необходимость отслеживать по какому урлу сейчас загрузилась страница. Просто лепим тег и не паримся.

    Что касается заканчивающегося слеша - при определённых настройках сервера страницы могу прекрасно существовать в обоих проявлениях со слешем и без и быть при этом с разным контентом. Слава богу что большинство современных серверов выполняет на автомате редирект в одно из состояний.

    Обычно неканонические ссылки возникают при двух случаях: глобальный глюк движка сайта и кривые внешние ссылки.
    Если взять мой сайт и сослаться на это страницу по ссылке http://www.varvashenia.ru/seo/canonical_url/bla-bla-bla, то CMS попытается подобрать ближайшую правильную страницу и там влепит тег canonical, что даст повод поисковику не плодить дубли, а тупо проигнорировать страницу. Попутно на такие страницы я вешаю заголовок 404 для более тупых ботов.

    Практическое применение тега вижу только одно - для того, что-бы злобные конкуренты не растащили вес вашего сайта по страницам-дублям (вашего же сайта) просто добавляя их в индекс с неправильными адресами.

    Надеюсь добавил ясности.

  • Отправлено:
  • Автор: (Анонимус)
  • Тема: Хороший материал (раскрывай подробно и делай нормальную статью)
  • Анонс статьи по форумам. Сам найдёшь каким. Оторвут с руками материал, если нормально распишешь и выделишь все плюсы и минусы.

    А вам, Дмитрий Анонимус, могу сказать, что вы хренов "умник". Если вы не в теме, то нечего с таким опломбом говорить, о том что в статье бред описывается. Когда на ваш вордпрес напихают ссылок со слешом и без слеша и когда Яша увидит по той и другой ссылке один и тот же контент, и так на 100+ страницах, то залетите вы под фильтр, как неопытная девка под юнцом.
  • Отправлено:
  • Автор: Dmitrii Varvashenia
  • Рус, писалось в качестве заметки для себя и раскрывать материал как-то дальше откровенно лениво ;)
    И эта, давайте жить дружно (с) Леопольд
  • Отправлено:
  • Автор: (Анонимус)
  • имхо каноникал - подсказка поисковику, что несколько урлов по каким-то причинам могут указывать на одну и ту же страницу, и потому чтобы поисковик не морочил себе голову - пусть он вместо всех алиасов использует для индексации только ту, которая указана в канонике. Как по мне, то не дай бог вставить на нормальной странице каноник на неправильную - будет только вред, гугл потеряет правильную страницу из индекса, с другой стороны, пусть гугл индексирует все мои страницы со всеми урлами, и занимается этим умняком сам, это вообще не моя забота как веб-разработчика, потому что реально пользы от каноника для меня 0, выключать вручную страницы из индекса - глупо, даже если это клоны, может на них внешние ссылки ведут, а гугл потеряет на них индекс, ну не глупо ли?
  • Отправлено:

Как вам материальчик? *



















Тема:

Мысль:

Как звать-то:

Почта:

PS: Комментарии публикуются только после проверки модератором.

PPS: E-mail'ы не публикуются.

* обязательные поля