Потестите парсер плз - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.4082
BTC/USD69553.4918
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 04.02.2008, 17:26
Start Post: Потестите парсер плз 
  #11
pina
хде мой компот?!
 
Регистрация: 07.01.2008
Сообщений: 327
Бабло: $31276
Отправить сообщение для pina с помощью ICQ
По умолчанию

Вот сам парсер, http://milok.biz/tools/blog_parser.php
По задумке он должен парсить блоги, но так же может парсить сайты... Потестите плиз кому не вломы. Пишите, пожалуйста, сюда ошибки которые заметили. В итоге после парсинга должен получиться контент который был на блоге/сайте с тегами b, strong, p, h1, h2 и т.д.

В поле Site url введите url той страницы которую хотите распарсить, обязательно с http:// или https://

PS: после тысячи обращений, откуда угодно, от кого угодно, он прекратит работу.
pina вне форума  
Старый 04.02.2008, 20:45   #12
kiwi
Senior Member
 
Регистрация: 30.03.2007
Сообщений: 13,553
Бабло: $22677065
По умолчанию

я, если честно, не смотрел, чего и как, но поделюсь своим опытом.
Когда Арахно писал под мои нужды парсер, мы сделали так - берем какой-то интересующий нас ресурс, первую страницу вытягиваем plain html'ем. После чего руками расставляем спец. метки, которые указывают на границы контента.
Одна страница сделана (это занимает примерно с минуту времени) - потом все автоматически и очень четко парсится. Есессна, забор новых статей и т.п. шел через rss
kiwi вне форума  
Старый 05.02.2008, 03:58   #13
mudoeb
Senior Member
 
Регистрация: 29.11.2007
Сообщений: 581
Бабло: $500
По умолчанию

парсер был составной частью кнопки бабло ?
mudoeb вне форума