Регулярка регулярочка - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.4409
BTC/USD64368.4221
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 20.09.2009, 19:14   #1
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
Angry Регулярка регулярочка

Надо раздуплиться в регулярных выражениях для парсинга. Уже пол дня мозг себе ебу, но все не работает как надо

Есть html, содержащий в себе такие фрагменты:

Код:
				<div class="watch-comment-body">
					<div>

						Hey, that's perfect!!))
					</div>
				</div>
Нам нужен этот Hey, that's perfect!!))
Через preg_match_all вытаскиваем.

Сто баксов не дам, дам 5$ за рабочую регулярочку
Drunk Monk вне форума  
Старый 20.09.2009, 19:18   #2
LeXxiK
Senior Member
 
Аватар для LeXxiK
 
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
По умолчанию

а strpos и substr не катит?
LeXxiK вне форума  
Старый 20.09.2009, 19:21   #3
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
ТС -->
автор темы ТС По умолчанию

Ну это же непрофессионально, и вроде ресурсы жрет сильнее, а мне тут пару сот k страниц спарсить надо
Drunk Monk вне форума  
Старый 20.09.2009, 19:22   #4
LeXxiK
Senior Member
 
Аватар для LeXxiK
 
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
По умолчанию

По ресурсам наборот, меньше жрёт)
LeXxiK вне форума  
Старый 20.09.2009, 19:23   #5
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
ТС -->
автор темы ТС По умолчанию

Точно?
Drunk Monk вне форума  
Старый 20.09.2009, 19:30   #6
LeXxiK
Senior Member
 
Аватар для LeXxiK
 
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
По умолчанию

точно)
Код:
$content=file_get_contents("http://");
$start=strpos($content,"watch-comment-body");
$start=strpos($content,"<div>",$start);
$start=$start+5;
$end=strpos($content,"</div",$start);
$opa=substr($content,$start,$end-$start);
echo $opa;
там пробелов только докуя получается в результате, надо убрать или считать конкретно номер первой буквы, сам допишешь?)
LeXxiK вне форума  
Старый 20.09.2009, 19:34   #7
Владимир
Ебланнед
 
Регистрация: 20.09.2008
Адрес: firefox
Сообщений: 158
Бабло: $26590
По умолчанию

\<div\sclass\=\"watch\-comment\-body\"\>\s*\<div\>\s*([\w\,\'\!\)]*)\s*\<\/div\>\s*\<\/div\>
Владимир вне форума  
Старый 20.09.2009, 19:35   #8
LeXxiK
Senior Member
 
Аватар для LeXxiK
 
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
По умолчанию

и как люди в них разбираются? набор символов)
LeXxiK вне форума  
Старый 20.09.2009, 19:36   #9
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
ТС -->
автор темы ТС По умолчанию

Да вырезать я сам умею.

А почему тогда все парсят регулярами или через dom, а на стрпос/субстр плюются?..
Drunk Monk вне форума  
Старый 20.09.2009, 19:44   #10
Drunk Monk
Je suis moine ivre
 
Аватар для Drunk Monk
 
Регистрация: 03.03.2009
Сообщений: 15,268
Бабло: $797172957
ТС -->
автор темы ТС По умолчанию

2 Владимир

PHP код:
<?
$content
=file_get_contents("http://porno.com");

preg_match_all("\<div\sclass\=\"watch\-comment\-body\"\>\s*\<div\>\s*([\w\,\'\!\)]*)\s*\<\/div\>\s*\<\/div\>"$content$res);

print_r($res);

?>
пока выдает:

Warning: preg_match_all() [function.preg-match-all]: Delimiter must not be alphanumeric or backslash in P:\home\d.com\www\ppp.php on line 4
Drunk Monk вне форума