6 февраля 2015

Карта сайта sitemap.xml в WordPress

Ни для кого не секрет, что карты сайта в формате xml, содержащие ссылки на публикации, очень полезны для поискового продвижения. Благодаря xml-карте поисковый робот с легкостью найдет и проиндексирует все страницы сайта.

Вот только существует одна проблема — чтобы среди ссылок на страницы сайта не было лишнего. Например, при загрузке изображений в WordPress при помощи админки (Вертикальное меню админки → Медиафайлы) на сайте появляются отдельные страницы для каждого изображения. Странная функция движка приводит к опасности попадания ссылок на эти страницы, совершенно не нужные поисковому роботу, в карту сайта.

Так и случится, если вы используете для построения карты сайта не заслуживший доверие Google XML Sitemaps, а возможность новой версии All in One Seo Pack. На рис. 1 показан скриншот карты сайта, построенный плагином All in One Seo Pack.

Построение карты сайта плагином All in One Seo Pack

Карта сайта, построенная плагином All in One Seo Pack
Рис. 1. Карта сайта, построенная плагином All in One Seo Pack. Красным выделены ссылки на страницы с изображениями, которые не нужны в индексе.

Поисковый робот перейдет по ссылкам в карте сайта и проиндексирует страницы, о которых вы и знать не знаете. При этом, если администратор активно использует функцию добавления картинок через админку, этих вредных ссылок будет очень много.

Функция построения карты сайта в плагине All in One Seo Pack активируется и деактивируется в меню настроек плагина в списке «Другие модули» (см. рис. 2).

Включение и выключение карты сайта в All in One Seo Pack

Рис. 2. Активация и деактивация построения карты сайта плагином All in One Seo Pack.

Мало того, если по какой-то причине построение карты сайта в All in One Seo Pack было однажды активировано, вы столкнетесь со следующей проблемой. После деактивации вредной функции ссылка на карту сайта (vashdomen.ru/sitemap.xml) будет открывать главную страницу (см. рис. 3). При этом главная страница будет открываться для данного адреса даже после установки нормального плагина Google XML Sitemaps. Только установка старой версии Google XML Sitemaps 3.x, физически создающей файлы карты сайта на сервере, решит проблему. Но об этом позже.

Ошибка при деактивации карты сайта в All in One Seo Pack
Рис. 3. Главная страница по адресу карты сайта в результате работы All in One Seo Pack.

Google XML Sitemaps

Я думаю уже понятно, что пользоваться возможностью All in One Seo Pack по построению карты сайта не нужно. Почему же возникают позывы все-таки использовать другую карту сайта, а не ту, что строит Google XML Sitemaps, ставшую в какой-то момент стандартом.

Все дело в обновлении, которое изменило привычный вид sitemap.xml. Раньше, до версии 4, Google XML Sitemaps строил такую карту, как на рис. 4. После обновления до четвертой версии карта сайта изменилась (см. рис. 5).

Google XML Sitemaps версии 3.x
Рис. 4. Карта сайта, построенная плагином Google XML Sitemaps версии 3.x.

Google XML Sitemaps версии 4.x
Рис. 5. Карта сайта, построенная новой версией Google XML Sitemaps 4.x.

Такое кардинальное изменение пугает новичков. Но, если прочесть пояснение по этому поводу на странице сайта разработчика, становится понятно, что новая карта более правильная и соответствует стандартам. Кроме того, еще и официальный блог Гугла применяет карту именно нового образца.

Но если никакие уговоры разработчика не заставляют вас принять новый вид карты сайта — скачайте старую версию 3.4.1 и будьте счастливы.

Проблема обновления Google XML Sitemaps

Как я заметил, многие веб-мастера, обновив Google XML Sitemaps, упускают важную вещь. Дело в том, что новая версия 4.x не кладет в корень вашего сайта физический файл sitemap.xml и  sitemap.xml.gz. Вместо этого она строит виртуальную карту, которая открывается при переходе на ссылку vashdomen.ru/sitemap.xml. Иногда, из-за неправильных настроек прав доступа, обновленный плагин не может удалить ненужные sitemap.xml и  sitemap.xml.gz. При этом в админке, на странице управления плагином, возникает сообщение, отмеченное на рис. 6.

Сообщение о необходимости удалить файлы
Рис. 6. Сообщение на странице настроек плагина Google XML Sitemaps после обновления, которое предлагает вручную удалить файлы sitemap.xml и  sitemap.xml.gz.

Что же произойдет, если файлы не удалить? Будет печалька. Посмотрите на рис. 4 и 7. В карте сайта на рис. 4 отсутствует ссылка на публикацию с адресом «new-post-2», тогда как  запись на сайте опубликована. Если удалить файлы sitemap.xml и  sitemap.xml.gz вручную, о чем нас просят на рис. 6, проблема решится и мы увидим ранее потерянную публикацию (см. рис. 7).

В новой версии отображаются все ссылки
Рис. 7. Новая версия карты сайта отображает больше ссылок, чем старая.

Отсюда мораль. Будьте бдительны 🙂