ПЛАГИН-АРХИВАТОР ДЛЯ WEBSITE WATCHER (плагин Владимира Каменского)

ПЛАГИН-АРХИВАТОР ДЛЯ WEBSITE WATCHER (плагин Владимира Каменского)

Автор — член Сообщества Практиков Конкурентной разведки Владимир Каменский.

Как известно, при всех многочисленных плюсах, программа для мониторинга изменений на страницах сайта Website Watcher имеет существенный недостаток. Дело в том. что Website Watcher показывает только состояние страницы в данный момент и предыдущее (отмечая желтым маркером изменения).

Корпоративный блог заказать

Корпоративный блог заказать

Что было еще раньше, он не показывает. Чтобы это исправить, член сообщества Практиков Конкурентной разведки Владимир Каменский сделал плагин, создающий копии страниц с изменениями и раскладывающий их автоматически по папкам. Для того, чтобы все это работало, требуется установить на компьютер официально бесплатное программное обеспеяение для работы скрипта. Как это сделать и как затем работать с Website watcher, описано ниже.

 

ВНИМАНИЕ! Для того. чтобы скрипт работал, ваша лицензия на программу WebSite Watcher должна быть не ниже, чем Personal. В более простых версиях работоспособность скриптов просто не предусмотрена.

Вопросы по применению плагина-архиватора для программы WebSite Watcher вы можете задать непосредственно автору — члену Сообщества Практиков Конкурентной разведки Владимиру Каменскому в ветке Форума Бизнес-разведчиков.

Подготовка к использованию решения:
1) установить интерпретатор языка Perl и указать при установке, чтобы была создана файловая ассоциация для расширения .pl (чтобы при открытии такого файла запускался интерпретатор Perl и выполнял скрипт в этом файле)
2) установить собственно WebSiteWatcher http://www.aignes.com/download.htm
3) установить планировщик задач в Windows nnCron http://www.nncron.ru/download/nncron191.exe
Чтобы она не начала требовать платной регистрации через некоторое время надо выполнить инструкцию по бесплатной регистрации для русскоязычных пользователей — http://www.nncron.ru/help/help_ru.htm

 

Непосредственная реализация решения (ВСЕ КАРТИНКИ КЛИКАБЕЛЬНЫ):

1. Создаем директорию C:\WSW
2. Запускаем WSW и создаем в нем новый файл закладок в файле C:\WSW\bookmark.wsw
-выбрать пункт меню «Файл»/»новый файл закладок»
-ответить Да(Yes) на предложение его создать
-в открывшемся окне выбора местоположения файла перейти в директорию C:\WSW и ввести имя файла — bookmark (расширение он потом сам подставит)
-удостовериться, что в директории C:\WSW появился файл bookmark.wsw
3. Добавить в него набор закладок для ссылок, которые будут подвергаться мониторингу (для примера возьмем www.rbc.ru и www.lenta.ru)

Далее смотрим картинки. Для добавления закладки щелкаем по иконе. показанной стрелкой

Корпоративный блог заказать

В открывшемся окне заполняем (показаны стрелками) поле URL ссылкой, а поле «Имя» — английским названием для ссылки.
После этого нажимаем внизу кнопку «Проверить» (тоже показана стрелкой) — и новая закладка добавлена, и сразу же первый раз скачана (чтобы было потом с чем сравнивать).

Я прошу самим заполнять поле «Имя» потому, что в противном случае имя закладки берется из заголовка самой HTML-страницы и может быть на русском языке, что нежелательно, так как WSW показываете его в Unicode .


Прикрепленный файл (wsw2.jpg, 55078 байт, скачан: 3 раза)

4. Выйти из WSW
5. Создать в директории C:\WSW поддиректории ARC и REP
6. Создать пустой файл с именем URL.INFO в директории C:\WSW\ARC (Shift-F4 в Total Commander)
7. Скачать из приложения > архив < и распаковать его содержимое прямо в C:\WSW

на всякий случай показываю, какие файлы должны быть в каких директориях

Прикрепленный файл (wsw3.jpg, 130145 байт, скачан: 10 раз)

Все готово для одиночного запуска — просто запускаем скрипт WSW.BAT. На какое-то время появится окно WSW. потом оно минимизируется, а потом все закончится.
Проверить, что все заработало, надо следующим образом — зайти в директорию C:\WSWARC и убедиться, что появились директории с именами, которые вы указывали в поле «Имя» для соответствующих закладок. В каждой из этих директорий должно быть минимум два файла (каждый запуск добавляет два новых) — в одном хранится версия страницы на момент запуска WSW.BAT, а в другом — та же версия, только в ней желтым показаны изменения по сравнению с предыдущей версией

Вот как выглядит у меня директория C:\WSW\ARC\RBC (для www.rbc.ru). Я запускал скрипт три раза и у меня шесть файлов.
И вот как выглядит директория C:\WSW\REP — в ней хранятся файлы отчетов WSW (по одному на каждый запуск)
Прикрепленный файл (wsw4.jpg, 127996 байт, скачан: 6 раз)

Архивные файлы нормально просматриваются браузером. И индексируются Яндекс Десктопом или Архивариусом. Теперь у Website Watcherесть своя база данных.

 

Теперь про автоматизацию запуска этого скрипта с помощью nncron.

1. В файловом менеджере(far, TotalCommander и т.д.) перейти в директорию C:\Program Files\nncron

2. В текстовом редакторе (клавиша F4 ) открыть файл nncron.tab
Прикрепленный файл (wsw5.jpg, 191256 байт, скачан: 2 раза)

3. Добавить в него в конец строку

*/15 * * * * * «C:\Program Files\WebSite-Watcher\wswatch.exe» /MINIMIZE /L /SCRIPT=»c:\wsw\save_history.wws» c:\wsw\bookmark.wsw

и сохранить этот файл

4. Дождаться наступления окончания очередных 15 минут и убедиться, что в директории с архивами появились новые страницы (и новый файл отчета WSW). Теперь WSW будет запускаться каждые 15 минут.
Прикрепленный файл (wsw6.jpg, 73349 байт, скачан: 0 раз)

Еще одно дополнение — по поводу nnCron.
Требуется его небольшая конфигурация. Он работает как сервис Windows. Нужно указать ему, что он запускается от имени пользователя, под которым вы работаете.

Для этого надо
-зайти в Start/Administrative Tools/Services
-выбрать сервис с именем nnCron

Прикрепленный файл (wsw7.jpg, 43028 байт, скачан: 3 раза)

указать, что он должен работать от имени пользователя, под которым работаете Вы (нужно указать как полное имя, так и пароль два раза, потом нажать кнопку «OK») и перезапустить сервис (выбрать этот сервис, щелкнуть по «Stop service», подождать, когда сервис остановится, а потом щелкнуть по «Start service»)

Прикрепленный файл (wsw8.jpg, 36838 байт, скачан: 2 раза)

Как конфигурировать nnCron, можно прочитать здесь:
http://www.nncron.ru/help/help_ru.htm и http://www.nncron.ru/help/RU/working/cron-format.htm

 

На главную страницу компании Ющука Евгения Леонидовича ООО «Маркетинг рисков и возможностей.»