go.mail.ru - парсер URL'ов - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.4409
BTC/USD66583.7573
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 27.03.2012, 18:12   #1
rashalist
Senior Member
 
Аватар для rashalist
 
Регистрация: 19.10.2011
Сообщений: 186
Бабло: $117100
По умолчанию go.mail.ru - парсер URL'ов

Вот что есть:
Код:
 $t=str_replace("&", "&", $t);
        $s='|<h3 class="res-head">(.*?)</h3>|Uis';  
	echo preg_match_all($s, $t, $mas);
	$urls=array_merge($urls, $mas[1]);
тут скрипт собирает всё что есть между <h3 class="res-head"></h3>

А надо собрать всё линки что около <h3 class="res-head">

но одно но <h3 class="res-head"> тут есть много пробелов потом уже сам линк

Как написать регулярку, буду благодарен.
rashalist вне форума  
Старый 27.03.2012, 18:32   #2
ZXSpectrum
Ебланнед
 
Регистрация: 11.03.2012
Сообщений: 32
Бабло: $9295
По умолчанию

Не совсем понял вопрос, если тебе просто надо собрать все линки с выдачи, то у меня работает простенькая регулярка,

$pattern = "#<a target=\"_blank\" href=\"(.*?)\">#is";

вродь не заметил чтоб лишнего забирала, проверяй
ZXSpectrum вне форума  
Старый 27.03.2012, 18:37   #3
rashalist
Senior Member
 
Аватар для rashalist
 
Регистрация: 19.10.2011
Сообщений: 186
Бабло: $117100
ТС -->
автор темы ТС По умолчанию

Только с выдачи надо, там грузит лишние урлы


Код:
10 
Array ( [0] => Трусы — Википедия [1] => Стильные трусы для мужчин [2] => Трусы с надписями. Прикольные трусы в интернет магазине. [3] => Картинки [4] => Видео [5] => Любовные шалости [6] => Прикольные модные трусы. АДСКИЕ МАЙКИ [7] => Нижнее мужское белье, мужские трусы во всем их разнообразии —... [8] => Женские трусы Милавица, трусы стринги, марок Aveline, Rosme,... [9] => Обсуждения )
нужны урлы между <h3 class="res-head">

я гружу страничку курлом
rashalist вне форума  
Старый 27.03.2012, 18:45   #4
ZXSpectrum
Ебланнед
 
Регистрация: 11.03.2012
Сообщений: 32
Бабло: $9295
По умолчанию

И опять не понял, тебе урлы надо собрать? Если их то у меня нет ничего лишнего, проверяй...
http://gyazo.com/c9044604020b859b69809dc937a30fa3
ZXSpectrum вне форума