Доброго времени суток уважаемые форумчани, хочу предложить вашему вниманию программу восстановления сайтов из веб-архива web.archive.org -
Web cache explorer.
Каким функционалом она обладает на данный момент:
- Рекурсивное выкачивания всех найденных страниц из web.archive.org с возможностью выбора даты начала парсинга и фильтрации страниц по дате.
- Все ссылки преобразовываются в относительные, в будущем будет добавлена опционально преобразования.
- Возможность замены произвольной части кода из скаченных страниц(например можно вставить код биржи ссылок после произвольного тега).
- Удаления кода и комментарий вставляемых веб-архивом.
- Возможность сохранения состояния процесса парсинга в файл проекта, для последующей загрузки его.
- Возможность отфильтровать страницы по трем критериям - расширению файла, вхождению указанных строк в адрес url и размеру файла.
- Корректная обработка 19 ответов web.archive.org и информирования пользователя.
- Многопоточность(до 50 потоков).
- Парсинг через прокси-сервер(HTTP(S),socks4,socks5).
- Корректная обработка и сохранения динамических страниц и редиректов(302,301) через mod_rewrite и .htaccess который программа создает автоматически.
- Обработка множества нестандартных ситуаций(url адресов длиной более 254 символов, бесконечных редиректов и многое другое, директорий, с именем похожих на имя файла(частая ситуация с ЧПУ) и множества других).
- Удобный выбор даты начала парсинга, с возможностью предварительного просмотра кол-тва проиндексированных страниц для каждого года и месяца.
Стоимость лицензии составляет 30 wmz на один компьютер, все последующие обновления программы бесплатны, за исключениям дополнительных модулей.
Узнать подробней о процедуре покупки вы сможете по ссылки:
Web cache explorer