Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Программы (скрипты) генераторов карты сайта sitemap.xml
Форум > Полезная информация > Прочее > Веб мастеру
Ribca
Программы (скрипты) генераторов карты сайта sitemap.xml
Продвижение сайта в Google, Yandex, Rambler


Для хорошей индексации сайта в Google от вебмастера требуется предоставить своего рода карту сайта в файле sitemap.xml. Кроме автоматического информирования о своих URL можно (и желательно) указать для каждого URL степень важности страницы (приоритет), дату последнего обновления и предполагаемую частоту обновления.
Вебмастер получает гораздо лучшую индексацию своего сайта и ! подробные отчеты о том, как Google направляет трафик на Ваш сайт и как робот Google видит Ваши страницы (полезные отчеты кстати). Такие отчеты, как например, статистика запросов, статистика сканирования, анализ страниц, статистика индекса и др. Т.е. неплохой инструмент для продвижения сайта.
Поместив файл sitemap.xml в корневую директорию сайта, достаточно кликнуть (находясь в своей учетной записи Google) "добавить sitemap".
Ничего не мешает использовать такую карту сайта и другим поисковым системам. Не знаю, используют ли другие поисковики файл sitemap.xml для Google в своих интересах, но если б я был другой поисковой системой, то обязззательно использовал бы.

Протокол файла sitemap.xml:
Цитата
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

Где две первые строки - это заголовок всего файла, последняя – признак окончания файла. Каждый URL должен быть описан между тэгами <url> и </url>, между <loc> и </loc> должен быть помещен URL страницы, между <lastmod> и </lastmod> дата последнего изменения страницы, между <changefreq> и </changefreq> вероятная частота изменения страницы, между <priority> и </priority> приоритет этого URL относительно других URL на Вашем сайте.
Если количество страниц на сайте невелико, то легко вручную составить такой файл в любом редакторе, позволяющем сохранить информацию в кодировке UTF-8. Файл должен быть сохранен как sitemap.xml. И все же намного удобнее использовать программу - генератор такого файла.
Google предлагает программу (генератор) такого файла с такими условиями:
На Вашем веб-сервере должен быть установлен Python 2.2 или более поздней версии.
И так далее…
Предлагаю два варианта генератора sitemap.xml:

1. Генератор на домашнем компьютере.
Если нет возможности запускать скрипты на сервере, например на narod.ru, или просто удобнее сгенерировать такой файл на своем домашнем компьютере, то небольшая программа на Perl поможет Вам в этом.
Условия: На компьютере должен быть установлен интерпретатор Perl (взять бесплатно можно здесь). Структура сайта на домашнем компьютере должна совпадать со структурой сайта на сервере.
Достаточно разместить генератор в корневую папку сайта и запустить на выполнение. В этой же папке будет создан файл sitemap.xml в соответствии с Вашими настройками и предпочтениями, а если таковой существует, то Внимание! – он будет заменен.

2. Генератор на веб-сервере.
Условие: на веб-сервере должен быть установлен Perl (есть везде).
Размещаем файл генератора sitemap-generator-server.pl в специально созданной папке (директории) в cgi-bin, например, полный путь к генератору на сервере: /home/public_html/cgi-bin/sitemap/sitemap-generator-server.pl на папку sitemap рекомендуется установить пароль (имя папки произвольное).
Запуск генератора производится путем обращения через Ваш браузер по адресу (например для http://blankinew.narod.ru/) http://blankinew.narod.ru/cgi-bin/sitemap/...rator-server.pl. Вы будете видеть процесс формирования sitemap.xml. Для удобства просмотра данные обозначены на русском языке.
Сам файл sitemap.xml будет создан в папке public_html в необходимом формате, и будет доступен, например, по адресу http://blankinew.narod.ru/sitemap.xml. А если таковой существует, то ! Внимание, он будет заменен.
Настройки(а) генераторов:
Одна настройка является обязательной - необходимо указать в переменной $core_site базовый URL Вашего сайта, например для моего: "http://blankinew.narod.ru/" или например: "http://www.site.ru/".
Для всех файлов, попадающих в sitemap.xml, программа автоматически укажет даты их последнего изменения в необходимом формате.
Дополнительно имеются две группы настроек:
1. Можно указать перечень исключений, файлы из которых НЕ попадут в sitemap.xml: список папок, список расширений (типов файлов), список имен файлов. Можно не указывать исключений совсем, или как угодно много.
2. Можно указать группы файлов с индивидуальными приоритетами и вероятной частотой изменений: папка, заданное(ые) расширение и для всех файлов из данной папки с заданными расширениями - приоритет и вероятная частота изменения. Таких списков может быть неограниченное количество или не быть совсем.
Для всех файлов по умолчанию установлена вероятная частота их изменения: monthly и приоритет: 0.9 (можно изменить).
Если настройки не указаны, действуют значения по умолчанию.
Подробнее о настройках в файле sitemap-readme.txt.
Формат для вероятной частоты изменения:
Цитата
always (всегда)
hourly (ежечасно)
daily (ежедневно)
weekly (еженедельно)
monthly (ежемесячно)
yearly (ежегодно)
never (никогда)

Формат для приоритетов: от 0.0 до 1.0

По поводу маскирования сущностей:
1. Символы в именах файлов & ' " > < я бы не стал называть сущностями.
2. Этот генератор предназначен для статичных сайтов (без динамических страниц) и пока маскирование не предусмотрено.

Пример готового файла sitemap.xml (фрагмент):
Цитата
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://blankinew.narod.ru/index.html</loc>
<lastmod>2007-05-29T17:46:56+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator.html</loc>
<lastmod>2007-04-23T22:42:42+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator-server.pl</loc>
<lastmod>2007-02-25T09:27:45+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
<url>
<loc>http://blankinew.narod.ru/sitemap-generator-server.pl</loc>
<lastmod>2007-02-25T09:27:45+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
</url>
……
</urlset>



Программа для генерации sitemap.xml на домашнем компьютере:
скачать генератор sitemap: Нажмите для просмотра прикрепленного файла
скачать файл: Нажмите для просмотра прикрепленного файла
Программа для генерации sitemap.xml на веб-сервере:
скачать генератор sitemap: Нажмите для просмотра прикрепленного файла
скачать файл: Нажмите для просмотра прикрепленного файла

взято тут: http://blankinew.narod.ru/sitemap-generator.html
Ribca
This modification adds a Sitemaps Generator task module to your Invision Power Board 2.2 install. The Sitemaps generator is to generate sitemaps useab v1.0.0

http://mods.invisionize.com/db/index.php/f/7443
kdg
Готовый он-лайн генератор карты сайта можете взять тут: http://htmlweb.ru/analiz/sitemap.php
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.

Форум IP.Board © 2001-2008 IPS, Inc.