Sitemaps: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
оформление, интервики
Строка 1: Строка 1:
'''Sitemaps''' — файл с информацией для поисковых систем (такие как [[Google]], [[Яндекс]]) о страницах сайта которые подлежат индексации, были изменены и как часто они обновляются. Sitemaps так же может помочь поисковикам определить местонахождение страниц вашего сайта. Иначе говоря Sitemaps это [[XML]] файл который включает в себя список [URL]-ов сайта с дополнительными метаданными о каждом URL (время последнего обновления, частота обновления, важность относительно других страниц сайта) для того чтобы поисковая машина смогла более разумно индексировать сайт.<ref>[http://www.sitemapwriter.com SitemapWriter]</ref>
'''Sitemaps''' — это [[XML]]-файл с информацией для [[поисковые системы|поисковых систем]] (таких как [[Google]], [[Yahoo]], [[Ask.com]] и [[MSN]]) о страницах [[веб-сайт]]а, которые подлежат [[индексация в поисковых системах|индексации]]. Sitemaps может помочь поисковикам определить местонахождение страниц сайта, время их последнего обновления, частоту обновления и важность относительно других страниц сайта для того, чтобы [[поисковая машина]] смогла более разумно индексировать сайт.<br />
Использование протокола Sitemaps не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование Вашего сайта.<ref>[http://www.sitemaps.org Sitemaps.org]</ref>
Использование [[сетевой протокол|протокол]]а Sitemaps не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование Вашего сайта.<ref>[http://www.sitemaps.org/ru Sitemaps.org]</ref>


==Формат протокола Sitemap==
==Формат протокола Sitemap==
Строка 23: Строка 23:
==Использование файлов индекса Sitemap==
==Использование файлов индекса Sitemap==


Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы его размер не превышал 10 МБ, и тем самым уменьшить требования к пропускной способности канала. Если необходимо перечислить более 50000 URL, следует создать несколько файлов Sitemap.
Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора [[gzip]], чтобы его размер не превышал 10 МБ, и тем самым уменьшить требования к пропускной способности канала.<br />
Если требуется передать несколько файлов Sitemap, необходимо перечислить каждый из этих файлов в файле индекса Sitemap. Индекс файла Sitemap представляет ссобой что-то похожее на XML сайтмепа для множества сайтмепов.
Если необходимо перечислить более 50000 URL, следует создать несколько файлов Sitemap, при этом необходимо перечислить каждый из этих файлов в '''файле индекса Sitemap''' ('''Sitemap index'''). Формат файла индекса Sitemap похож на формат файла Sitemap.

Подробная информация об использовании файлов индекса Sitemap на официальном сайте: [http://www.sitemaps.org/ru/protocol.php#index sitemaps.org].


==Другие форматы файла Sitemap==
==Другие форматы файла Sitemap==
*Канал синдикации ([[RSS]] 2.0, а также Atom 0.3 или 1.0)
*Канал синдикации ([[RSS]] 2.0, а также Atom 0.3 или 1.0)
*Текстовый файл (В этом текстовом файле в каждой строке должен быть только один URL)
*Текстовый файл (в текстовом файле в каждой строке должен быть только один URL)


==Местоположение файла Sitemap==
==Местоположение файла Sitemap==


Строго рекомендуется ставить сайтмеп файл в корневой директории сервера, чтобы ссылка выглядела примерно так: <nowiki>http://example.ru/sitemap.xml</nowiki>.
Рекомендуется распологать файл Sitemap в корневой директории сервера, чтобы ссылка выглядела примерно так: http://example.com/sitemap.xml.


*Все ссылки, перечисленные в файле Sitemap, должны находиться в том же [[Доменное имя|домене]], что и сам Sitemap.
Все ссылки перечисленные в Sitemap файле должны находиться на том же узле что и сам сайтмеп файл. Например если сайтмеп файл находится на <nowiki>http://www.example.ru/sitemap.xml</nowiki> то он не может включить в себя ссылки страниц с <nowiki>http://субдомен.example.ru</nowiki>. Если сайтмеп файл находится на <nowiki>http://www.example.ru/моя_папка/sitemap.xml</nowiki> то он не может включать в себя ссылки страниц с <nowiki>http://www.example.ru</nowiki>.
*:Например, если файл Sitemap находится по адресу http://www.example.com/sitemap.xml, то он не может включать в себя ссылки страниц с доменов http://subdomain.example.com или http://example.com.
*Ссылки в файле Sitemap должны указывать на страницы, находящиеся в том же каталоге (или его подкаталогах), что и сам файл Sitemap.
*:Например, если файл Sitemap находится на http://www.example.com/catalog/sitemap.xml то он не может включать в себя ссылки на страницы http://www.example.com/page.html или http://www.example.com/dir/page.html.
*Ссылки, указанные в файле Sitemap должны использовать тот же протокол (например, [[HTTP]]), по которому доступен файл Sitemap.
*:Это значит, что если файл Sitemap находится на http://www.example.com/sitemap.xml, то он не может содержать ссылки типа https://www.example.com/page.html и ftp://www.example.com/file.doc.


==Проверка файла Sitemap==
==Проверка файла Sitemap==


Для определения элементов и атрибутов, которые могут появляться в Вашем файле Sitemap, используются следующие XML-схемы. Эту схему можно загрузить с помощью приведенных ниже ссылок.
Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:
*Для файлов Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd

Для файлов Sitemap: <nowiki>http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd</nowiki>
*Для файлов индекса Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

Для файлов индекса Sitemap: <nowiki>http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd</nowiki>


==Уведомления для сканеров поисковых систем==
==Уведомления для сканеров поисковых систем==


После того как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом.
После того, как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом:


* передача файла Sitemap с помощью интерфейса передачи поисковой системы
*с помощью интерфейса поисковой системы
* как указать местоположение файла Sitemap в файле robots.txt
*указав местоположение файла Sitemap в файле [[robots.txt]]
* как выслать запрос HTTP
*выслав HTTP-запрос


Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.
Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.

===Использование файла robots.txt===

Чтобы сообщить поисковым системам местоположение файла Sitemap, можно в robots.txt добавить стройку вида:
<pre>
Sitemap: <sitemap_location>
</pre>
Где <sitemap_location> - полный URL файла Sitemap, например: http://www.example.com/sitemap.xml.

===Использование HTTP-запроса===

Можно указать поисковым системам местонахождение файла Sitemap при помощи HTTP-запроса, используя таблицу:
{| class="wikitable"
|-
! Поисковая система
! HTTP-запрос
|-
| [[Google]]
| <nowiki>http://www.google.com/webmasters/sitemaps/ping?sitemap=<sitemap_location></nowiki>
|-
| [[Yahoo]]
| <nowiki>http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=<sitemap_location></nowiki>
|-
| [[Ask.com]]
| <nowiki>http://submissions.ask.com/ping?sitemap=<sitemap_location></nowiki>
|}
Где <sitemap_location> необходимо заменить на полный URL файла Sitemap.<br />Например, чтобы добавить файл http://www.example.com/sitemap.xml в поисковик Google, нужно отправить HTTP-запрос ''<nowiki>http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.example.com/sitemap.xml</nowiki>''.


==Редакторы Sitemap==
==Редакторы Sitemap==

* [http://code.google.com/sm_thirdparty.html Редакторы Sitemap в Google Code]
* [http://code.google.com/sm_thirdparty.html Редакторы Sitemap в Google Code]
* [http://www.sitemapwriter.com/download.php Sitemap Writer Pro] новый инструмент пока не добавленный в этот список.
* [http://www.sitemapwriter.com/download.php Sitemap Writer Pro] новый инструмент пока не добавленный в этот список.
Строка 62: Строка 95:


==Ссылки==
==Ссылки==
* [http://www.sitemaps.org Официальная страница]
* [http://www.sitemaps.org Официальный сайт] {{ref-en}}
* [http://google.com/webmasters/sitemaps/docs/en/faq.html Google ЧАВО]
* [http://www.sitemaps.org/ru Официальный сайт] {{ref-ru}}
* [http://www.google.com/support/webmasters/bin/topic.py?topic=8476&hl=ru Управление файлами Google Sitemaps]


[[Категория:XML]]
[[Категория:XML]]
[[Категория:Поисковые системы]]
[[Категория:Поисковые системы]]

[[en:Sitemaps]]

Версия от 21:23, 22 сентября 2007

Sitemaps — это XML-файл с информацией для поисковых систем (таких как Google, Yahoo, Ask.com и MSN) о страницах веб-сайта, которые подлежат индексации. Sitemaps может помочь поисковикам определить местонахождение страниц сайта, время их последнего обновления, частоту обновления и важность относительно других страниц сайта для того, чтобы поисковая машина смогла более разумно индексировать сайт.
Использование протокола Sitemaps не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование Вашего сайта.[1]

Формат протокола Sitemap

Формат протокола Sitemap состоит из XML-тегов. В файле необходимо использовать кодировку UTF-8.

Пример XML-файла Sitemap

Ниже приведен пример файла Sitemap, в котором содержится только один URL-адрес и использованы все необязательные теги.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
      <loc>http://example.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>
</urlset>

Использование файлов индекса Sitemap

Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы его размер не превышал 10 МБ, и тем самым уменьшить требования к пропускной способности канала.
Если необходимо перечислить более 50000 URL, следует создать несколько файлов Sitemap, при этом необходимо перечислить каждый из этих файлов в файле индекса Sitemap (Sitemap index). Формат файла индекса Sitemap похож на формат файла Sitemap.

Подробная информация об использовании файлов индекса Sitemap на официальном сайте: sitemaps.org.

Другие форматы файла Sitemap

  • Канал синдикации (RSS 2.0, а также Atom 0.3 или 1.0)
  • Текстовый файл (в текстовом файле в каждой строке должен быть только один URL)

Местоположение файла Sitemap

Рекомендуется распологать файл Sitemap в корневой директории сервера, чтобы ссылка выглядела примерно так: http://example.com/sitemap.xml.

Проверка файла Sitemap

Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:

Уведомления для сканеров поисковых систем

После того, как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом:

  • с помощью интерфейса поисковой системы
  • указав местоположение файла Sitemap в файле robots.txt
  • выслав HTTP-запрос

Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.

Использование файла robots.txt

Чтобы сообщить поисковым системам местоположение файла Sitemap, можно в robots.txt добавить стройку вида:

Sitemap: <sitemap_location>

Где <sitemap_location> - полный URL файла Sitemap, например: http://www.example.com/sitemap.xml.

Использование HTTP-запроса

Можно указать поисковым системам местонахождение файла Sitemap при помощи HTTP-запроса, используя таблицу:

Поисковая система HTTP-запрос
Google http://www.google.com/webmasters/sitemaps/ping?sitemap=<sitemap_location>
Yahoo http://search.yahooapis.com/SiteExplorerService/V1/ping?sitemap=<sitemap_location>
Ask.com http://submissions.ask.com/ping?sitemap=<sitemap_location>

Где <sitemap_location> необходимо заменить на полный URL файла Sitemap.
Например, чтобы добавить файл http://www.example.com/sitemap.xml в поисковик Google, нужно отправить HTTP-запрос http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.example.com/sitemap.xml.

Редакторы Sitemap

Примечания

  1. Sitemaps.org

Ссылки