Карта сайта – Sitemaps

Карта сайта Sitemaps – это специальный файл, созданный для поисковых систем Google, Яндекс, Bing, Yahoo и других, который содержит информацию о страницах сайта. Данный файл помогает правильно индексировать сайт и включает такие параметры, как важность конкретной страницы относительно других страниц сайта (приоритет страницы), частоту и дату последнего обновления.

В одном файле Sitemaps можно указать до 50000 URL. При этом размер файла Sitemaps должен быть не более 50 МБ (52 428 800 байт). В случае, если вы имеете дело с объемным сайтом и размер файла Sitemaps превышает допустимый лимит, можно сжать файл Sitemaps при помощи программы архиватора gzip. А в случаях, если количество страниц сайта свыше 50000,  можно указать несколько файлов Sitemap, перечислив их в файле индекса Sitemap (Sitemap index).

Официальная страница протокола Sitemap: https://www.sitemaps.org

Пример карты сайта (XML файл Sitemap) с одним URL

Официальный сайт протокола Sitemap предоставляет такой пример xml файла Sitemap. Данный пример карты сайта содержит только одну страницу, также в данном файле содержаться дополнительные (необязательные) атрибуты <lastmod>, <changefreq> и <priority>.

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

   <url>

      <loc>http://www.24hit.com/</loc>

      <lastmod>2018-01-01</lastmod>

      <changefreq>monthly</changefreq>

      <priority>0.8</priority>

   </url>

Пример карты сайта (XML файл Sitemap) с несколькими URL

На официальном сайте  Sitemap представлен следующий пример xml файла Sitemap для сайта с несколькими страницами и дополнительными атрибутами <lastmod>, <changefreq> и <priority>.

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.24hit.org/schemas/sitemap/0.9">

   <url>

      <loc>http://www.24hit.com/</loc>

      <lastmod>2018-01-01</lastmod>

      <changefreq>monthly</changefreq>

      <priority>0.8</priority>

   </url>

   <url>

      <loc>http://www.24hit.com/catalog?item=12</loc>

      <changefreq>weekly</changefreq>

   </url>

   <url>

      <loc>http://www.24hit.com/catalog?item=73</loc>

      <lastmod>2018-12-23</lastmod>

      <changefreq>weekly</changefreq>

   </url>

   <url>

      <loc>http://www.24hit.com/catalog?item=74</loc>

      <lastmod>2018-12-23T18:00:15+00:00</lastmod>

      <priority>0.3</priority>

   </url>

   <url>

      <loc>http://www.24hit.com/catalog?item=83</loc>

      <lastmod>2018-11-23</lastmod>

   </url>

</urlset>

Пример файла индекса карты сайта Sitemap (создание группы файлов Sitemap)

Как мы писали ранее, в одном файле карты сайта Sitemap можно указать не более 50000 URL. В случае, если требуется составить карту сайта с более 50000 страницами, необходимо создать группу файлов sitemap и файл индекса карты сайта. Файл индекса карты сайта Sitemapимеет схожую структуру с XML файлом Sitemap. Называться файл индекса карты может, например, sitemap_index.xml.

Официальный сайт протокола Sitemap предоставляет такой пример файла индекса карты сайта Sitemap. Данный пример карты сайта содержит дополнительный (необязательный) атрибут <lastmod>.

<?xml version="1.0" encoding="UTF-8"?>

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

   <sitemap>

      <loc>http://www.24hit.com/sitemap1.xml.gz</loc>

      <lastmod>2018-10-01T18:23:17+00:00</lastmod>

   </sitemap>

   <sitemap>

      <loc>http://www.24hit.com/sitemap2.xml.gz</loc>

      <lastmod>2018-01-01</lastmod>

   </sitemap>

</sitemapindex>

Как добавить файл карты сайта Sitemaps на хостинг и в поисковые системы

Самым популярным способом добавления карты сайта на сайт, является заливка готового файла карты сайта на хостинг через фтп и указание его месторасположения в файле robots.txt. Для того, чтобы указать месторасположение файла карты сайта Sitemaps в файле robots.txt, необходимо добавить строку, которая будет содержать полный адрес к файлу на хостинге. Например:

Sitemap: http://www.24hit.com/sitemap.xml

Если на сайте используется файл индекса Sitemap – следует указать местоположение именно этого файла.

После этого, по мере обхода поисковыми роботами вашего сайта, файл карты сайта будет найден и проанализирован. Также это можно сделать при помощи интерфейса поисковой системы, http-запросом.

Например, для поисковой системы Google, такой запрос будет иметь вид:

https://google.com/ping?sitemap=http://www.24hit.com/sitemap.xml

Для поисковика Bing: https://www.bing.com/ping?sitemap=http://www.24hit.com/sitemap.xml

http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=http://www.24hit.com/sitemap.xml

В представленных запросах http://www.24hit.com/sitemap.xml – это адрес нашей карты сайта.