Регулярка парсинга ссылок - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB93.7196
BTC/USD62234.4229
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 13.07.2009, 00:08   #1
Hector
hustle
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: 3d world
Сообщений: 12,890
Бабло: $1717315
Отправить сообщение для Hector с помощью Jabber
По умолчанию Регулярка парсинга ссылок

Короче нужна регулярка которая будет парсить ссылки (активные, неактивные, текстом и тп).

Спасибо )

У меня есть вот такая:
PHP код:
preg_match_all('%(http\:\/\/[\-A-Za-z0-9\+\&\@\#\/\%\?\=\~\_\|\!\:\,\.\;]*)%si'$r$result); 
Вроде как работает но мало ли...
Hector вне форума  
Старый 13.07.2009, 00:11   #2
serrgo
Senior Member
 
Регистрация: 28.06.2008
Сообщений: 106
Бабло: $9397
По умолчанию

\b(https?|ftp|file)://[-A-Z0-9+&@#/%?=~_|!:,.;]*[-A-Z0-9+&@#/%=~_|]
serrgo вне форума  
Старый 13.07.2009, 08:59   #3
ziavra
Senior Member
 
Регистрация: 10.04.2007
Адрес: Balifor
Сообщений: 468
Бабло: $29318
По умолчанию

Код:
!(https?):\/\/([a-z]([a-z0-9\-]*\.)+([a-z]{2}|aero|arpa|biz|com|coop|edu|gov|info|int|jobs|mil|museum|name|nato|net|org|pro|travel)|(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]))(\/[a-z0-9_\-\.~]+)*(\/([a-z0-9_\-\.]*)(\?[a-z0-9+_\-\.%=&]*)?)?(#[a-z][a-z0-9_]*)?!i
ziavra вне форума  
Старый 13.07.2009, 10:41   #4
Hector
hustle
 
Аватар для Hector
 
Регистрация: 02.05.2008
Адрес: 3d world
Сообщений: 12,890
Бабло: $1717315
ТС -->
Отправить сообщение для Hector с помощью Jabber
автор темы ТС По умолчанию

(\?[a-z0-9+_\-\.%=&]*)?) - а этот вот кусок что делает? исключает?
Hector вне форума  
Старый 13.07.2009, 11:32   #5
ziavra
Senior Member
 
Регистрация: 10.04.2007
Адрес: Balifor
Сообщений: 468
Бабло: $29318
По умолчанию

Цитата:
Сообщение от Hector Посмотреть сообщение
(\?[a-z0-9+_\-\.%=&]*)?) - а этот вот кусок что делает? исключает?
Я , честно говоря, не разбирался что там внутри. Это взято откуда-то готовое , выглядит внушительно, да еще и работает ко всему прочему. Сейчас попытаюсь разобраться с этим куском

Upd: Это похоже кусок, отвечающий за параметрамы в урле, т.е. "?" за которым идёт что-то из [a-z0-9+_\-\.%=&] в любых кол-вах.
Это "(#[a-z][a-z0-9_]*)?" соответвенно за анкоры в урле, т.е. вида #test
ziavra вне форума  
Старый 13.07.2009, 14:39   #6
esatm22
Ебланнед
 
Регистрация: 22.06.2009
Сообщений: 138
Бабло: $49530
По умолчанию

ребят, а не поможете с настройкой Aggress Autopost и Aggress Parser?
esatm22 вне форума  
Старый 13.07.2009, 15:12   #7
bop
Юниор
 
Регистрация: 07.05.2008
Сообщений: 19
Бабло: $395
По умолчанию

Цитата:
Сообщение от esatm22 Посмотреть сообщение
ребят, а не поможете с настройкой Aggress Autopost и Aggress Parser?
не пользуйся ими там вирусы..
bop вне форума