Продвижение сайта. Программы (скрипты) генераторов карты сайта sitemap.xml на Perl, фрагмент файла sitemap.xml, скачать скрипты
     
 
Бланки
для
предпринимателей
Для Вас
на сайте:

blankinew.narod.ru
 
     
       
   

Продвижение сайта.
Программы (скрипты) генераторов карты сайта sitemap.xml

Для хорошей индексации сайта в поисковиках от вебмастера требуется предоставить своего рода карту сайта в файле sitemap.xml. Кроме автоматического информирования о своих URL можно (и желательно) указать для каждого URL степень важности страницы (приоритет), дату последнего обновления и предполагаемую частоту обновления.
Вебмастер получает гораздо лучшую индексацию своего сайта и ! подробные отчеты о том, как поисковики направляют трафик на Ваш сайт и как робот поисковика видит Ваши страницы (полезные отчеты кстати). Такие отчеты, как например, статистика запросов, статистика сканирования, анализ страниц, статистика индекса и др. Т.е. неплохой инструмент для продвижения сайта.
Поместив файл sitemap.xml в корневую директорию сайта, достаточно кликнуть (находясь в своей учетной записи Google) "добавить sitemap".

Протокол файла sitemap.xml:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
  <loc>http://www.example.com/</loc>
   <lastmod>2005-01-01</lastmod>
    <changefreq>monthly</changefreq>
   <priority>0.8</priority>
  </url>
 </urlset>
Где две первые строки - это заголовок всего файла, последняя – признак окончания файла. Каждый URL должен быть описан между тэгами <url> и </url>, между <loc> и </loc> должен быть помещен URL страницы, между <lastmod> и </lastmod> дата последнего изменения страницы, между <changefreq> и </changefreq> вероятная частота изменения страницы, между <priority> и </priority> приоритет этого URL относительно других URL на Вашем сайте.
Если количество страниц на сайте невелико, то легко вручную составить такой файл в любом редакторе, позволяющем сохранить информацию в кодировке UTF-8. Файл должен быть сохранен как sitemap.xml. И все же намного удобнее использовать программу - генератор такого файла.
Google предлагает программу (генератор) такого файла с такими условиями:
На Вашем веб-сервере должен быть установлен Python 2.2 или более поздней версии.
И так далее…
Предлагаю два варианта генератора sitemap.xml:
1. Генератор на домашнем компьютере.
Если нет возможности запускать скрипты на сервере, например на narod.ru, или просто удобнее сгенерировать такой файл на своем домашнем компьютере, то небольшая программа на Perl поможет Вам в этом.
Условия: На компьютере должен быть установлен интерпретатор Perl (взять бесплатно можно здесь). Структура сайта на домашнем компьютере должна совпадать со структурой сайта на сервере.
Достаточно разместить генератор в корневую папку сайта и запустить на выполнение. В этой же папке будет создан файл sitemap.xml в соответствии с Вашими настройками и предпочтениями, а если таковой существует, то Внимание! – он будет заменен.
2. Генератор на веб-сервере.
Условие: на веб-сервере должен быть установлен Perl (есть везде).
Размещаем файл генератора sitemap-generator-server.pl в специально созданной папке (директории) в cgi-bin, например, полный путь к генератору на сервере: /home/public_html/cgi-bin/sitemap/sitemap-generator-server.pl на папку sitemap рекомендуется установить пароль (имя папки произвольное).
Запуск генератора производится путем обращения через Ваш браузер по адресу (например для http://blankinew.narod.ru/) http://blankinew.narod.ru/cgi-bin/sitemap/sitemap-generator-server.pl. Вы будете видеть процесс формирования sitemap.xml. Для удобства просмотра данные обозначены на русском языке.
Сам файл sitemap.xml будет создан в папке public_html в необходимом формате, и будет доступен, например, по адресу http://blankinew.narod.ru/sitemap.xml. А если таковой существует, то ! Внимание, он будет заменен.
Настройки(а) генераторов:
Одна настройка является обязательной - необходимо указать в переменной $core_site базовый URL Вашего сайта, например для моего: "http://blankinew.narod.ru/" или например: "http://www.site.ru/".
Для всех файлов, попадающих в sitemap.xml, программа автоматически укажет даты их последнего изменения в необходимом формате.
Дополнительно имеются две группы настроек:
1. Можно указать перечень исключений, файлы из которых НЕ попадут в sitemap.xml: список папок, список расширений (типов файлов), список имен файлов. Можно не указывать исключений совсем, или как угодно много.
2. Можно указать группы файлов с индивидуальными приоритетами и вероятной частотой изменений: папка, заданное(ые) расширение и для всех файлов из данной папки с заданными расширениями - приоритет и вероятная частота изменения. Таких списков может быть неограниченное количество или не быть совсем.
Для всех файлов по умолчанию установлена вероятная частота их изменения: monthly и приоритет: 0.9 (можно изменить).
Если настройки не указаны, действуют значения по умолчанию.
Подробнее о настройках в файле sitemap-readme.txt.
Формат для вероятной частоты изменения:
always (всегда)
hourly (ежечасно)
daily (ежедневно)
weekly (еженедельно)
monthly (ежемесячно)
yearly (ежегодно)
never (никогда)
Формат для приоритетов: от 0.0 до 1.0
По поводу маскирования сущностей:
1. Символы в именах файлов & ' " > < я бы не стал называть сущностями.
2. Этот генератор предназначен для статичных сайтов (без динамических страниц) и пока маскирование не предусмотрено.
Пример готового файла sitemap.xml (фрагмент):
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://blankinew.narod.ru/index.html</loc>
<lastmod>2013-05-29T17:46:56+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator.html</loc>
<lastmod>2013-04-23T22:42:42+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator-server.pl</loc>
<lastmod>2013-02-25T09:27:45+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator-server.pl</loc>
<lastmod>2013-02-25T09:27:45+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
……
</urlset>
Программа для генерации sitemap.xml на домашнем компьютере:

скачать генератор sitemap (файл sitemap-generator.pl) 3 КВ
скачать файл sitemap-readme.txt 3 КВ
Программа для генерации sitemap.xml на веб-сервере:
скачать генератор sitemap (файл sitemap-generator-server.pl) 4 КВ
скачать файл read-me-sitemap-server.txt 4 КВ

   
Дмитрий Рассанов
2014