|
| Дата |
|
USD/RUB | 93.7196 | BTC/USD | 64096.2495 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
01.01.2011, 21:37
|
#1
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 703
Бабло: $174690
|
помогите со скриптом
вот тот самый скрипт, которым берутся кеи с догпайла. Хотел его немного изменить так, чтоб он брал кеи, например, отсюда http://fifa10.isgreat.org. Что, кроме 5-ой строки с урлом нужно ещё переделать?
PHP код:
<?
function get_keyword()
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.dogpile.com/dogpile/ws/service/DPServices.asmx/GetSearchSpy');
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json'));
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, '{"numTerms":'.mt_rand(15,36).',"filter":true}'); // numTerms - кол-во кеев за раз ;)
$response = curl_exec($ch);
curl_close($ch);
$feed = new SimpleXMLElement($response);
$out=array();
foreach ($feed->channel->item as $item)
{
$key=(string)$item->title . '';
if(count(explode(' ', $key))>=3 && !ereg('oogle|dating|pussy|sex|porn|ass|model|fuck|cock|naked|celebrit|tit|anal|oral|blowjob|mature|nude|lolita|zoo|lady|tube|vid|mov|pic|rape|child|erot', $key))
{
if(check_dupes($key)==true)
{
$out[]=$key;
}
}
}
if(count($out)>0)
{
$fd=fopen('./used.txt','a+');
fwrite($fd, trim($out[0])."\r\n");
fclose($fd);
return array($out[0]);
}
return false;
}
?>
|
|
|
01.01.2011, 22:33
|
#2
|
Senior Member
Регистрация: 19.09.2009
Сообщений: 4,096
Бабло: $611825
|
Я может что-то не понимаю? но на http://fifa10.isgreat.org/ одни и теже кеи все время) Не проще открыть в браузере и сохранить?
|
|
|
01.01.2011, 22:45
|
#3
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 703
Бабло: $174690
ТС -->
|
ТС
не, этот сайт я просто как пример привёл). Мне нужно скрипт адаптировать к взятию кеев именно с таких статичных страниц как эта
|
|
|
01.01.2011, 22:53
|
#4
|
Senior Member
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
|
Цитата:
Сообщение от buratin0
Что, кроме 5-ой строки с урлом нужно ещё переделать?
|
всё остальное))
|
|
|
01.01.2011, 23:18
|
#5
|
Senior Member
Регистрация: 19.09.2009
Сообщений: 4,096
Бабло: $611825
|
Цитата:
Сообщение от buratin0
не, этот сайт я просто как пример привёл). Мне нужно скрипт адаптировать к взятию кеев именно с таких статичных страниц как эта
|
Для каждого сайта могут понадобиться разные параметры.
PHP код:
system("wget -c -U Mozilla \"http://site.com\" >result.txt");
А можно и без php, то, что я привел это для линукса
|
|
|
01.01.2011, 23:36
|
#6
|
Senior Member
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
|
PHP код:
<?php
function get_keyword()
{
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://fifa10.isgreat.org/');
curl_setopt($ch, CURLOPT_USERAGENT, 'Opera/9.80 (X11; Linux i686; U; en-US) Presto/2.6.30 Version/10.62');
curl_setopt($ch, CURLOPT_TIMEOUT, 5);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$response = strip_tags(curl_exec($ch));
curl_close($ch);
$keywords_tmp = explode("\n",$response);
foreach ($keywords_tmp as $values){
if (strlen($values)>3) $keywords[] = $values;
}
foreach ($keywords as $item)
{
$key=$item;
if(count(explode(' ', $key))>=3 && !ereg('oogle|dating|pussy|sex|porn|ass|model|fuck|cock|naked|celebrit|tit|anal|oral|blowjob|mature|nude|lolita|zoo|lady|tube|vid|mov|pic|rape|child|erot', $key))
{
if(check_dupes($key)==true)
{
$out[]=$key;
}
}
}
if(count($out)>0)
{
$fd=fopen('./used.txt','a+');
fwrite($fd, trim($out[0])."\r\n");
fclose($fd);
return array($out[0]);
}
return false;
}
?>
Спарсит все и засунет в массив $keywords, дальнейшая обработка ХЗ
|
|
|
01.01.2011, 23:58
|
#7
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 703
Бабло: $174690
ТС -->
|
ТС
не, тогда получается не то что нужно.
Объясню по-другому:
PHP код:
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.dogpile.com/dogpile/ws/service/DPServices.asmx/GetSearchSpy');
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json'));
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, '{"numTerms":'.mt_rand(15,36).',"filter":true}'); // numTerms - кол-во кеев за раз ;)
$response = curl_exec($ch);
curl_close($ch);
этот скрипт успешно собирает рандомное число кеев зараз с этой страницы http://www.dogpile.com/dogpile/ws/se...x/GetSearchSpy
Я хочу просто изменить источник сбора кеев, т.е. заменить
http://www.dogpile.com/dogpile/ws/se...x/GetSearchSpy
на
http://fifa10.isgreat.org
ничего другого менять не нужно.
Я, как человек, плохо знакомый с ПХП, тупо меняю линк в коде. Но, как и следовало ожидать, это не срабатывает. Т.е. кеи не собираются. Вот я и спрашиваю, мож там чего ещё нужно дописать?
P.S. пока писАл, incognito уже ответил. Сейчас затестю
|
|
|
02.01.2011, 00:12
|
#8
|
Senior Member
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
|
buratin0, чтобы спарсить именно эту страницу этот скрипт нафиг не нужен, потому что в другом будет не только урл другой, но и всё остальное. Там не просто голый текст, исходный код посмотри. Совсем необязательно, что на другом урле новый скрипт сработает.
|
|
|
02.01.2011, 00:25
|
#9
|
Senior Member
Регистрация: 19.09.2009
Сообщений: 4,096
Бабло: $611825
|
То, что ты просишь скрипт очень не сложный, поэтому советую потратить несколько дней на изучение php на начальном уровне, иначе вряд ли тебе кто-то поможет. Один шаг влево и ты приплыл
|
|
|
02.01.2011, 01:21
|
#10
|
Mr. Lucky Guy
Регистрация: 27.07.2010
Адрес: RU -> DE -> Asia
Сообщений: 703
Бабло: $174690
ТС -->
|
ТС
Incognito, твой вариант работает, спасибо! Вот только как сделать, чтоб он брал не все ключи за раз, а 10-20 ключей рандомно, т.е. случайные кеи, не по порядку?
|
|
|
|