Proteus web crawler ( PWC ) - сканнер/грэббер/парсер сторонних сайтов в сети интернет
Proteus web crawler ( PWC ) - программа, предназначенная для сканирования, скачивания и парсинга сторонних сайтов в сети интернет.
!!!Важно!!! В случаях попыток применения программы для кражи интеллектуальной собственности, лицензия на исользование аннулируется !!!
Основным целевым предназначением PWC является атвоматическая синхронизация наличия, цен и других параметров товаров в интернет-магазине с сайтами поставщиков.
В PWC предусмотрена панель администратора, благодаря чему добавление/удаление/редактирование сайтов, страниц и параметров скачивания обходится без изменения программного кода.
Так же для обработки нестандартных блоков информации, например, подгружаемых при помощи javaScript, предусмотрен механизм добавления внешних скриптов-обработчиков, что позволяет сопровождать PWC без вмешательства в программное ядро.
Таким образом, покупая PWC, вы приобретаете УНИВЕРСАЛЬНЫЙ ИНСТРУМЕНТ для скачивания информации с ЛЮБЫХ САЙТОВ, не подгружающих важные блоки информации при помощи технологии ajax.
При этом, благодаря возможности администрирования и подгрузки внешних скриптов-обработчиков, вы с легкостью сможете использовать и сопровождать программу без нашего участия.
Получаемые данные могут храниться в виде .СSV, .XML, .XLSX файлов, или файла базы данных MySQL.
Отметим, что количество сканируемых сайтов и страниц, а так же скачиваемых элементов не ограничено настройками программы, при этом обращение к сайту-донору с 1го айпи чаще чем раз в 2-5 секунд с большой долей вероятности будет воспринято как спам. Потому в случае необходимости ускорения загрузки данных, можно воспользоваться одним, или несколькими выделенными айпи адресами.
На данный момент выполняется обновление программных модулей PWC, потому продажи приостановлены. Релиз PWC 2.0 будет сопряжен с релизом PTSE