Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB58.7570
BTC/USD0.0000
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 27.09.2013, 03:16   #1
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 33
Бабло: $7895
По умолчанию Парсинг HTML и рендеринг в PNG

Обгуглился , может кто подскажет, чем осуществить, пакетный парсинг набора урлов и по регулярному выражению/классу и рендеринг в изображение. Смотрел решения на WebKit и т.п., что-то сложно.
Pakotorn вне форума  
Старый 27.09.2013, 04:27   #2
WebNinja
grablab.org
 
Аватар для WebNinja
 
Регистрация: 18.09.2007
Адрес: Thailand
Сообщений: 4,903
Бабло: $322214
Отправить сообщение для WebNinja с помощью ICQ Отправить сообщение для WebNinja с помощью Skype™
По умолчанию

с вебкитом запарно это все делать. есть сервисы с апи https://browshot.com/api/documentation типа того
WebNinja вне форума  
Старый 27.09.2013, 04:28   #3
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,382
Бабло: $470735
По умолчанию

тоже интересны решения.

но можно пойти с другой стороны: найти какой-нибудь сервис, который делает сайт-превью и его по-эксплуатировать.
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума  
Старый 27.09.2013, 06:10   #4
chizer
Senior Member
 
Аватар для chizer
 
Регистрация: 01.02.2011
Сообщений: 732
Бабло: $191845
По умолчанию

вы издеваетесь? https://www.google.nl/search?q=%D1%8...B-WI4AT3s4HYBA
chizer вне форума  
Старый 27.09.2013, 08:30   #5
rushter
Senior Member
 
Регистрация: 28.11.2009
Сообщений: 1,804
Бабло: $299365
По умолчанию

Цитата:
Сообщение от WebNinja Посмотреть сообщение
с вебкитом запарно это все делать. есть сервисы с апи https://browshot.com/api/documentation типа того
С вебкитом как раз легче некуда. Скриншотилка самого сайта - 40 строк, определённой области 50-60 через xpath.
rushter вне форума  
Старый 27.09.2013, 10:38   #6
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 33
Бабло: $7895
ТС -->
автор темы ТС По умолчанию

chizer, нет мы не издеваемся ... надо только часть вебстраницы по HTML коду. Сохранять всю картинку и потом обрабатывать тоже не катит ... резиновая верстка.
rushter, мм xpath посмотрю, спасибо
Pakotorn вне форума  
Старый 27.09.2013, 11:10   #7
rushter
Senior Member
 
Регистрация: 28.11.2009
Сообщений: 1,804
Бабло: $299365
По умолчанию

https://github.com/potyl/Webkit/blob.../screenshot.pl
Вот решение готовое есть, параметр xpath есть.
rushter вне форума  
Старый 27.09.2013, 22:42   #8
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 33
Бабло: $7895
ТС -->
автор темы ТС По умолчанию

там все так просто я понятно ... кроме установки =))), пробовал и на CentOS и на Ubuntu ... бесконечные зависимости, не осилил
Pakotorn вне форума  
Старый 27.09.2013, 23:22   #9
krob
Senior Member
 
Аватар для krob
 
Регистрация: 29.04.2011
Сообщений: 378
Бабло: $111340
По умолчанию

PhantomJs + casperjs решает это проблему вроде очень быстро
если мне память не изменяет то там код для скриншота страниц занимает до 10 строк
krob вне форума  
Старый 28.09.2013, 04:45   #10
chizer
Senior Member
 
Аватар для chizer
 
Регистрация: 01.02.2011
Сообщений: 732
Бабло: $191845
По умолчанию

Цитата:
Сообщение от Pakotorn Посмотреть сообщение
chizer, нет мы не издеваемся ... надо только часть вебстраницы по HTML коду. Сохранять всю картинку и потом обрабатывать тоже не катит ... резиновая верстка.
rushter, мм xpath посмотрю, спасибо
ссори, в 6 утра и не так тупишь

krob, вроде оно

captureSelector()

еще есть
fetchText()

надо попробовать.
chizer вне форума  
Закрытая тема



Опции темы
Опции просмотра