Sitemap.xml

Для эффективного продвижения сайта необходима его полная и регулярная индексация поисковыми системами. Указания роботам о доступных для сканирования страницах размещают в файле Sitemap. Он представляет собой XML-документ (реже txt), перечисляющий URL-адреса ресурса, каждому из которых соответствуют метаданные (частота изменений, дата последних обновлений, приоритетность страницы для сканирования относительно сайта).

Использование протокола Sitemap не гарантирует полной индексации сайта, но позволяет роботам произвести более тщательное сканирование. Его версию 1.0 поддерживают Google, Yandex, Yahoo!, Bing и Ask.com.

Файл Sitemap полезен для эффективной раскрутки сайта, если ресурс:

  • содержит страницы с изображениями или мультимедийным AJAX-контентом, которые не могут быть обнаруженны поисковыми роботами при сканировании, динамическую составляющую или большой архив документов, не перелинкованных между собой;
  • создан недавно и не имеет достаточной внешней ссылочной массы.
Местоположение

Файл Sitemap располагают в корневой директории сервера (например, http://site.ru/sitemap.xml). Все перечисленные ссылки должны принадлежать тому же доменному имени, что и файл, указывать на находящиеся в том же разделе или подразделах страницы и использовать тот же протокол, по которому доступен Sitemap.

Формат

В файле Sitemap необходимо использование кодировки UTF-8, маскирование символов ‘ “ > <  и &. Формат протокола состоит из XML-тегов.

Обязательные теги:

  • urlset указывает стандарт протокола и инкапсулирует файл. Открывающий необходим в начале документа, закрывающий — в конце,
  • url — родительский тег для каждого URL,
  • loc — URL-адрес веб-страницы, начинается с префикса и заканчивается символом /. Его длина ограничивается 2048 символами.

Необязательные теги:

  • lastmod — дата последнего изменения в формате W3C Datetime, позволяющем опустить сегмент времени и при необходимости использовать вид ГГГГ-ММ-ДД.
  • changefreq — предполагаемая частота обновлений данной страницы. Допустимы значения always (для описания документов, изменяющихся при каждом доступе к ним), hourly, daily, weekly, monthly, yearly и never (для архивных адресов).
  • priority — приоритетность данного URL-адреса относительно других на ресурсе. Позволяет выделить страницы с наиболее важными для поисковой оптимизации сайта запросами. Стандартный диапазон значений от 0 до 1 (по умолчанию 0.5).

Количество адресов в файле Sitemap не должно превышать 50 000, максимальный размер — 10 МБ. Допускается сжимать файл архиватором gzip для уменьшения требований к пропускной способности канала. При необходимости описания более 50 000 адресов создают несколько файлов Sitemap.

Все термины SEO-Википедии
Теги термина

Какие услуги тебе подходят

(Рейтинг: 5, Голосов: 6)