Выкачать сайт из Webarchive - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB89.7026
BTC/USD68599.1854
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 15.05.2017, 12:31
Start Post: Выкачать сайт из Webarchive 
  #21
ukrpunk
Senior Member
 
Регистрация: 14.05.2015
Сообщений: 128
Бабло: $30129
Question

Есть нормальный сервис по выкачке страниц сайта из вебархива?
попробовал robo2.net и r-tools.org (я так понимаю одно и то же) чет херого сохраняют, в веб-архиве полная копия со всеми css,js , image файлами, а сервисы ток текст сохранили)))

мож кто знает рабочий софт\сервисы шоб дал им урл на страницу архива - получил то же самое что в вебархиве сохранено?
ukrpunk вне форума  
Старый 30.05.2017, 03:42   #22
Germeso
Member
 
Аватар для Germeso
 
Регистрация: 06.01.2016
Сообщений: 48
Бабло: $21650
По умолчанию

Цитата:
Сообщение от Gimly Посмотреть сообщение
Germeso, выложи сюда домен который криво скачался, абсолютное большинство скачивается в том же виде что на вебархиве.
Т.к. сайт клиентский то не могу его палить в паблик, отправил в личку

Цитата:
Сообщение от pyramida Посмотреть сообщение
Цитата:
Сообщение от Gimly
выложи сюда домен который криво скачался
я бы тоже посмотрел. Сайты сами кривые и косые, ьрать их и пилить в любом случае надо. А тут прямо кнопка бабло за 500 рэ без пруфов
Лень по ссылкам уже кликать? https://kwork.ru/configuration/24607...polnaya-kopiya
Какие ещё пруфы нужны?

Я делаю копии "под ключ" и их не требуется пилить.

Немного подробностей:
- обрабатываются (сохраняются) все редиректы любой вложенности
- копию можно заливать на любой домен с сохранением всех путей
- вытягиваются все js, css, swf и все файлы вложений (doc, xls, mp4, zip, rar и т.п.)
- сохраняются ВСЕ файлы независимо от даты, но копия актуализируется на выбранную дату
- внешние ссылки закрываются nofollow
- лог всех скопированных файлов и всех отсутствующих (битых) файлов
Germeso вне форума  
Старый 30.05.2017, 08:15   #23
pyramida
Юниор
 
Регистрация: 13.09.2015
Сообщений: 13
Бабло: $2550
По умолчанию

Цитата:
Сообщение от Germeso
Лень по ссылкам уже кликать?
Что, я должен был там увидеть? Объявление на фонарном столбе? Мне менеджер серпстата, вчера тоже доказывала актуальность их данных. Только почему то толком не объяснила, как они показывают данные, по доменам которые уже не существуют.
pyramida вне форума  
Старый 30.05.2017, 08:45   #24
Germeso
Member
 
Аватар для Germeso
 
Регистрация: 06.01.2016
Сообщений: 48
Бабло: $21650
По умолчанию

Цитата:
Сообщение от pyramida Посмотреть сообщение
Цитата:
Сообщение от Germeso
Лень по ссылкам уже кликать?
Что, я должен был там увидеть? Объявление на фонарном столбе?
Ничего, забей.
Germeso вне форума  
Старый 30.05.2017, 14:24   #25
Gimly
Senior Member
 
Аватар для Gimly
 
Регистрация: 30.09.2008
Сообщений: 364
Бабло: $84955
Отправить сообщение для Gimly с помощью ICQ
По умолчанию

Цитата:
Сообщение от Germeso
Т.к. сайт клиентский то не могу его палить в паблик, отправил в личку


К сожалению не могу проверить твои слова, но навязчивая реклама доверия не внушает. 2 одинаковых поста в одном топике "все сервисы - гавно, заказывайте у меня"
По поводу количества файлов, их все можно получить одним запросом к api вебархива, но зачем пользователю скачивать и заливать кучу ненужных файлов?
Gimly вне форума  
Старый 30.05.2017, 22:54   #26
Germeso
Member
 
Аватар для Germeso
 
Регистрация: 06.01.2016
Сообщений: 48
Бабло: $21650
По умолчанию

Цитата:
Сообщение от Gimly Посмотреть сообщение
Цитата:
Сообщение от Germeso
Т.к. сайт клиентский то не могу его палить в паблик, отправил в личку
К сожалению не могу проверить твои слова, но навязчивая реклама доверия не внушает. 2 одинаковых поста в одном топике "все сервисы - гавно, заказывайте у меня"
По поводу количества файлов, их все можно получить одним запросом к api вебархива, но зачем пользователю скачивать и заливать кучу ненужных файлов?
К сожалению клиент закрыл его, когда я проверял он был открыт. Попробую с другим сайтом как время будет.

А все остальные сервисы объективно - говно полное, это неоспоримый ФАКТ лично для меня, иначе мне не пришлось бы писать собственный парсер. Мне вот прям делать нечего было да? Если бы ХОТЬ ОДИН сервис работал - я бы им пользовался с радостью. А не работает ни один до сих пор! Ни наши, ни буржуйские которые по $70 в мес хотят - такие же кривые и неполные копии выдают, я почти все тестировал. Кто-то ими доволен? Ну флаг в руки и барабан на шею. У меня они ни один сайт не смогли нормально спарсить.
Germeso вне форума  
Старый 31.05.2017, 08:53   #27
Skyworker
Senior Member
 
Регистрация: 25.12.2013
Сообщений: 6,586
Бабло: $785925
По умолчанию

Вчера на гитхабе нарыл отличный парсер и грабер Вебархива, довольно свежий.
__________________
Надежный и отзывчивый VPS хостинг для серьезных проектов
Проверенная годами пуш партнерка с ежедневными выплатами
Skyworker вне форума  
Старый 14.06.2017, 22:28   #28
Gimly
Senior Member
 
Аватар для Gimly
 
Регистрация: 30.09.2008
Сообщений: 364
Бабло: $84955
Отправить сообщение для Gimly с помощью ICQ
По умолчанию

Всем скинул, раздача инвайтов закончена, задолбался в личку писать, почти 50 шт раздал. Кто не успел - подпишитесь на этот топик, напишу здесь, когда сделаем открытую регистрацию.
Gimly вне форума  
Старый 14.06.2017, 23:53   #29
malishka
Ебланнед
 
Регистрация: 28.11.2009
Сообщений: 875
Бабло: $257825
По умолчанию

Привет, пиши мне, есть хороший скрипт - правда, может надо чуток подправить, если разметка изменилась, но думаю не проблема - в свое время много тысяч страниц этим скриптом наколошматил.
__________________
Edu-Revenue.com – самая прибыльная партнерка в нише эссе. Платят до 75% от каждой новой продажи и до 35% за ребил!
malishka вне форума  
Старый 17.07.2017, 21:00   #30
Gimly
Senior Member
 
Аватар для Gimly
 
Регистрация: 30.09.2008
Сообщений: 364
Бабло: $84955
Отправить сообщение для Gimly с помощью ICQ
По умолчанию

кому не хватило инвайтов, регистрация открыта http://archiveorg.download/
Gimly вне форума  
Старый 17.07.2017, 21:40   #31
yandexru
Ебланнед
 
Регистрация: 13.02.2016
Сообщений: 1,404
Бабло: $194295
По умолчанию

как то я по другому делаю.
1. заходишь в поиск веб архива ищешь по тематике
2 выбираешь у найденного сайта древний год и проверяешь пару статей на уник
3. качаешь донлоудером
4 чистишь Duplicate File Finder
5 публикуешь текст китом
6. проверяешь сайт на уник текст.ру
много движений
yandexru вне форума