Канонический хаос: удвоение дублированного контента

  1. Хитрые дубликаты
  2. Канонический хаос
  3. HTTP и HTTPS
  4. Почему это происходит?
  5. Исправление ваших канонических
  6. Один URL, чтобы управлять ими всеми

Поисковые системы становятся умнее. В этом мало сомнений. Однако в сети, управляемой CMS, где контент часто может существовать по нескольким URL-адресам, не всегда понятно, какой авторитетный URL-адрес для данного фрагмента содержимого. Кроме того, наличие контента по нескольким URL-адресам может привести к проблемам с распределением сигналов ссылок и ранжирования по нескольким вариантам фрагмента контента.

Достаточно сложно выделиться в зачастую гиперконкурентном поисковом ландшафте, поэтому вы можете себе представить, что большинство компаний контролировали эти фундаментальные проблемы SEO. К сожалению, наш опыт сказал бы нам иначе. На самом деле, кажется, что в результате многих сайтов движение к HTTPS для обещанного повышения рейтинга мы видим еще больше проблем с дублированным контентом на основе URL, чем раньше.

К счастью, у нас есть канонический тег. С помощью rel = canonical мы можем легко указать официальный URL для любого фрагмента контента. Google и другие движки затем объединят сигналы ссылок и ранжирования для всех вариантов этого контента на одном URL. Это, конечно, если rel = canonical правильно реализован.

В этой статье я расскажу о том, как неправильная реализация канонических URL-адресов может усугубить дублирование содержимого на основе URL-адресов. Я также привожу пример британского магазина электронной коммерции, в котором недавно была отменена индексация их домашней страницы (только домашней страницы) из-за того, что, по-видимому, возникла проблема с каноническими URL-адресами.

Хитрые дубликаты

Нередко часть контента существует по нескольким URL-адресам. Это может быть на одном сайте или нескольких. Это может быть связано с поддоменами. Это может быть связано с тем, что ваша CMS создает несколько точек входа для одного фрагмента контента. Это также может быть связано с запуском вашего сайта HTTPS в соответствии с последними рекомендациями Google ,

Существует множество потенциальных ситуаций, которые могут привести к тому, что часть контента будет доступна по нескольким URL-адресам, но наиболее распространенными являются:

  • Динамические URL - например, http://example.com/?post=1&var=2&var=3.
  • Мобильные сайты - например, m.example.com и www.example.com
  • Международные сайты без правильного геотаргетинга
  • Проблемы с www и поддоменами - например, www.example.com или example.com
  • CMS генерирует несколько URL
  • Синдикация контента в других блогах
  • Работа вашего сайта на HTTP и HTTPS

Мы также склонны видеть смесь этих проблем, и нет ничего необычного в том, чтобы находить сайты, работающие по протоколам HTTP и HTTPS и имеющие контент, доступный в версиях сайта www и не www. Это может быстро создать ситуацию, когда один и тот же фрагмент контента (или домашняя страница) может быть доступен по нескольким различным URL-адресам.

Например, только очень распространенный запуск сайта с www и без него, а также через HTTP и HTTPS может создать четыре потенциальных URL для каждого фрагмента контента на сайте:

  • http://example.com/page
  • http://www.example.com/page
  • https://example.com/page
  • https://www.example.com/page

Канонический хаос

Теперь, в идеальном мире, ваш канонический URL будет разбираться с этим, и у каждого из четырех URL будет один и тот же указанный канонический URL. Это может быть любой из вышеперечисленных, но если у вас HTTPS, вы также можете работать с HTTPS, поэтому допустим, что ваш канонический URL-адрес https://www.example.com. Вы поместите этот кусок кода в заголовок HTML всех остальных версий:

<link rel = "canonical" href = "https://www.example.com" />

Я видел дебаты о том, должна ли настоящая каноническая страница канонизироваться сама по себе - на практике мы это делаем, и я видел, как это мнение повторялось другими оптимизаторами в течение многих лет (и никогда не сталкивался с такими проблемами).

К сожалению, в последнее время мы видим, что присутствует канонический тег, но каждая страница имеет канонический тег, соответствующий URL-адресу, показанному в окне браузера.

  • http://example.com/page canonical = http://example.com/page
  • http://www.example.com/page canonical = http://www.example.com/page
  • https://example.com/page canonical = https://example.com/page
  • https://www.example.com/page canonical = https://www.example.com/page

Понятно, что это не идеально. Канонический тег предназначен для решения этих самых проблем, но в этом случае он еще больше усугубляет ситуацию. Каждый URL здесь говорит: «Я, я, внесите меня в указатель !!!». Тогда поисковая система должна делать все возможное с этим беспорядком.

Такие вопросы влияют на доверие и уверенность. Доверие и уверенность влияют на рейтинг. Плохой рейтинг влияет на ваш бизнес. Все это может звучать как то, что может сказать SEO Йода, но реальность такова, что глупая каноническая метка только негативно повлияет на ваши результаты.

Недавно мы работали с британским бизнесом, который увидел загадочную де-индексацию их домашней страницы, что сильно ударило по целевым ключевым словам. Как правило, они входят в число amazon.co.uk и других крупных брендов в первой тройке, поэтому здесь нет места для этих проблем. После проверки всех обычных подозреваемых, мы определили проблемы с реализацией канонического тега - это было исправлено, сайт был просканирован, и домашняя страница снова открылась. Я был несколько поражен, но это говорит о важности надежного технического SEO.

К счастью, это произошло, и мы решили это как раз перед большой рождественской лихорадкой - но если бы эта проблема всплыла сейчас, финансовые последствия могли быть намного хуже.

HTTP и HTTPS

Переход на HTTPS, как правило, хорошая вещь. Вопросы безопасности. И сеть быстрее, чем когда-то. Тем не менее, мы видели здесь всевозможные проблемы, как правило, из-за индексации сайта по вариациям URL HTTP и HTTPS.

К сожалению, мы также склонны видеть, что канонические теги используют как HTTP, так и HTTPS, что еще больше усугубляет основную проблему, которую должен решить канонический тег.

Почему это происходит?

Я считаю, что есть несколько причин, по которым мы видим эти проблемы:

  1. Сайт работает по протоколам HTTP и HTTPS, и CMS не может принудительно настроить протокол и / или поддомен для канонических URL-адресов.
  1. Разработчики используют подход с использованием контрольного списка для SEO, реализуя канонический тег, не понимая, для чего он предназначен, и заполняя его адресной строкой URL.

Исправление ваших канонических

В большинстве случаев проблемы с дублированным содержимым могут быть решены довольно легко. Исправление канонического является одним из способов, но это может быть сложно с некоторым программным обеспечением веб-CMS, поэтому мы можем использовать постоянные перенаправления HTTP (301). Обычно это самый быстрый и самый логичный подход в том, что вариант страницы никогда не сканируется, и Google не нужно анализировать несколько страниц - они просто следуют перенаправлению.

  1. 301 перенаправление. Если вы можете перенаправить, сделайте перенаправление. Это более быстрый и предпочтительный подход, как заявил Джон Мюллер из Google , Перенаправить на ваш любимый поддомен. Перенаправить на ваш предпочитаемый протокол. Часто вы можете реализовать простое, универсальное правило перенаправления это решает 90 процентов этого одним махом.
  1. Правильные каноники. Там, где требуется каноническое, вам нужно реализовать каноническое на уровне страницы от одного варианта к другому. Как и выше, определите свой основной поддомен и протокол и убедитесь, что все дубликаты имеют каноническое указание на основную страницу.

Это почти все - всегда перенаправляйте, если можете, так как он решает проблемы с дублированием контента самым быстрым и эффективным способом (с точки зрения рабочей нагрузки и ранжирования).

Затем, если это невозможно или нежелательно, реализуйте канонические теги на уровне страницы. Это может нуждаться в поддержке разработчика.

Конечно, для WordPress есть простое исправление используя фильтр wpseo_canonical из плагина WordPress SEO. Это позволяет вам использовать HTTP или HTTPS или поддомен с помощью некоторого довольно простого PHP. Ваш разработчик часто может сделать то же самое, чтобы помочь вам с другими CMS и заказными сборками. Это не очень сложно, просто требуется четкое понимание того, почему существует каноническое.

Один URL, чтобы управлять ими всеми

Нередко часть контента появляется на нескольких URL. Есть нет штрафов за дублирование контента в качестве таких. Однако для того, чтобы поисковая система была на 100 процентов уверена в правильности URL-адреса для возврата и для обеспечения консолидации всего капитала в одной основной версии страницы, нам нужны точные перенаправления и канонические URL-адреса.

Простого добавления плагина SEO или взлома вашего разработчика в каноническом URL недостаточно - его необходимо реализовать таким образом, чтобы каждый фрагмент контента имел один авторитетный URL.

Один URL, чтобы управлять ими всеми. Один URL, чтобы найти их. Один URL, чтобы привести их всех и в результатах поиска связать их.

Мнения, выраженные в этой статье, принадлежат автору гостя и не обязательно относятся к Search Engine Land. Штатные авторы перечислены Вот ,


Об авторе

Com/?
Почему это происходит?
Меню сайта
Новости
Ошибка Открытия Драйвера Казаки
Ошибка Microsoft Visual C++ Runtime Library. Как исправить? Здравствуйте. Не так давно помогал одному хорошему знакомому с настройкой компьютера: у него при запуске любой игры выскакивала ошибка Microsoft

Волчья сотня | Si vis pacem, para bellum!
02/06/2012 Волчья сотня «Волчья сотня» — неофициальное название 2-й сотни 2-го Аргунского полка Забайкальского казачьего войска в Русско-японскую войну 1904—1905 годов. Казаки-аргунцы,

Обаяние мужественности и профессионализма Андрей Казаков
Обаяние мужественности и профессионализма Имя Андрея Казакова долгое время было хорошо известно лишь столичным любителям театра. Актер и режиссер, удостоенный звания Заслуженного артиста и нескольких

Тайна "Тихого Дона" Шолохова: своровал или нет?
Несколько поколений литературоведов и историков спорили о том, мог ли полуграмотный казак Михаил Шолохов написать "Тихий Дон", да ещё в 23 года, не имея необходимого для романа-эпопеи жизненного опыта.

Андрей Казаков / Andrei Kazakov
Детство и юность Андрея Казакова Путь к сцене Андрея Казакова был долгим и причудливым. Молодой человек попробовал себя в нескольких профессиях и только потом решил стать актером. Андрей родился в семье

Взятие Азова донскими казаками в 1637 году
Автор: А. Пивоваров Источник: "Донские казаки". Краткій сборникъ разсказовъ изъ военной жизни Донцовъ, о ихъ храбрости, находчивости въ бою, преданности долгу и проч.Новочеркасская типография. 1892

Василий Иванович Баженов (1737–1799)
Один из основоположников русского классицизма. Учился в "архитектурной команде" Г. В. Ухтомского и в Академии художеств с момента се основания. Проектировал Большой Кремлевский дворец в Москве.

КИРИЛЛ КОЗАКОВ ВИКИПЕДИЯ - Кирилл Козаков биография актера, фото, личная жизнь
Школьные годы Михаил Козаков вспоминает с неохотой. Актер театра и кино, сын известного советского актера Михаила Козакова. Михаил Козаков родился 14 октября 1934 года в Ленинграде. Описание отчество

Все ответы на игру Угадай слово по подсказке
Нас уже на самом деле давно просили сделать ответы для этой игры, но из-за большого количества уровней на это ушло колоссальное количество времени. Но наконец-то мы их сделали и рады вам сказать, что

Атака казаков. Фильм Тихий Дон.avi
( 5 г. назад ) эпизод из сериала Девять жизней Нестора Махно 6 серия ( 8 г. назад ) 29 апреля 1648 год Желтые воды ( 12 мес.

Реклама