Sape Sitemap Generator - Карта сайта для Sape

Сперва ссылка для скачивания, обсуждение программы.

Теперь обо всём по порядку.

Зачем нужна эта программа:
Чтобы добиться полной индексации ботами Sape вашего сайта, даже если на нём полно страниц с УВ4 и с УВ5.

Как это работает:
Вся суть заключается в цитате из хелпа сапы:
У робота-индексатора есть ограничение по количеству внутренних ссылок, по которым он переходит вглубь сайта. Для главной - 500, для 2-го уровня - 150.

Для того, чтобы наш сайт был полностью проиндексирован, необходимо учесть эту особенность робота-индексатора, и подстроить под неё наш сайт. Как? А вот так:

Берется Sitemap в формате XML. Из неё вытаскивается список всех страниц вашего сайта, этот список разбивается на несколько частей (к примеру, по 150 ссылок в каждой) и сохраняется в виде нескольких html-страниц. Также формируется код блока ссылок на эти страницы.

Вы закачиваете получившеюся html карту сайта себе на сервер и вставляете код блока ссылок на файлы карты на главную страницу. Отправляете заявку на переиндексацию в Sape.

Таким образом на вашем сайте будут только страницы с УВ 1,2,3. Плюс карта сильно облегчит работу робота-индексатора Sape.

Как на это смотрят модераторы Sape:
Сквозь пальцы. Ведь вы же не собираетесь удалять карту после индексации ботами Sape? =) Значит все честно. Во всяком случае, на момент написания программы, я не нашел правила, запрещающего это. Если оно появилось, велкам в комментарии.

Преимущества перед аналогами:
Возможность более гибкой настройки внешнего вида карты сайта. Возможность, например, сделать так, чтобы все файлы sitemap'a лежали в одной отдельной папке, а не в "корне" и т.п.

Создание XML Sitemap:
Для создания XML карты сайта можете воспользоваться либо плагином для вашей CMS (для Wordpress это Google XML Sitemap Generator) или программой SiteMap Generator.

Инструкция по эксплуатации программы:
Открываете файл SSG.exe. Потом Файл -> Открыть. Выбираете XML-файл, содержащий карту вашего сайта. Если вам повезло и в вашем sitemap'e не несколько тысяч страниц, а несколько десятков тысяч страниц, то при открытие файла программа может подвиснуть на время считывания данных (ненадолго, паниковать не надо).

При настройке параметра "Ссылок на один файл" следует учитывать особенность работа индексатора сапы, которая была приведена выше:

У робота-индексатора есть ограничение по количеству внутренних ссылок, по которым он переходит вглубь сайта. Для главной - 500, для 2-го уровня - 150.

Поэтому не рекомендуется устанавливать этот параметр больше 150. И да, про полную индексацию (если конечно у вашего сайта больше 75 000 страниц (150*500)) я в начале соврал =)

Описания тегов:
#PAGENMB# - номер страницы карты сайта: 1, 2, 3 и т.д.
#LINKNMB# - номер ссылки на страницу вашего сайта
#URL# - адрес ссылки на страницу вашего сайта
#PAGENAME# - имя файла карты сайта (например sitemap1.html)

Про теги #TITLE# и #H# будет написано ниже.

После нажатия кнопки "GO" в папке sitemap/yoursite.com/ будут сгенерированы файлы карты сайта. Блок ссылок на них можно скопировать либо из поля "Код для размещения на главной странице", либо из файла toindex.txt, который лежит в той же папке, что и карта.

Настройка шаблона карты сайта:
Шаблон карты хранится в файле template/index.html. По умолчанию он имеет следующий вид:

<html>
   <head>
      <title>#TITLE#</title>
   </head>
   <body>
      #H#<br>
      #LINKS#
   </body>
</html>

Ну с тегом #TITLE# я думаю всё понятно. Тег #H# используется для вставки заголовка на страницу. На место тега #LINKS# вставляется список ссылок, этот тег должен обязательно присутствовать в шаблоне.

Вы можете произвольно менять шаблон и добиться того, чтобы карта сайта выглядела, к примеру, так:


??????? ??????????

??-??, ? ???-?? ???? ????? ??????????? ? ???????? ???-?????? ????????.
?????????? ??????? ??? ???????? ??? ???????? ?????? ????? ? Sape. ???? ?? ? ??????? ?? ?????? 3.
?????? ?????? ???????????? ???????? ?? ??????!


????????? ??????

?????????? ??????

???????