помогите накодить скрипт - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Объявления о покупке/продаже товаров и услуг
Дата
USD/RUB88.4375
BTC/USD68041.5319
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве.

Закрытая тема
Опции темы Опции просмотра
Старый 01.04.2013, 15:28
Start Post: помогите накодить скрипт 
  #11
xShadow
Ебланнед
 
Регистрация: 07.05.2012
Сообщений: 35
Бабло: $23985
По умолчанию

нужно спарсить все домены с http://whoistory.com/
Заплачу 5-7 бачей. спасибо
сорри что не в том разделе. оч срочно
xShadow вне форума  
Старый 01.04.2013, 19:36   #12
xShadow
Ебланнед
 
Регистрация: 07.05.2012
Сообщений: 35
Бабло: $23985
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
PHP код:
<?php
###########################################################
## 
## Парсим http://whoistory.com/2006/02/28/
## 
###########################################################
set_time_limit(1500);

$i 0;
do{
    
$data date('Y/m/d'strtotime('-'.$i.' day'));
    
$urlsArr[] = 'http://whoistory.com/' $data .'/';
    if(
$data=="2006/02/01") break;
    
$i++;
}while(
true);
//echo implode('<br>',$urlsArr);

$handle fopen('trash.txt''w+');
$domainArr = array();
foreach(
$urlsArr as $value){
    
$html file_get_contents($value);
    
preg_match_all('#.ru.html">(.*?\.ru)<\/a><br#',$html,$domainArrTmp);
    
//$domainArr = array_merge($domainArr,$domainArrTmp[1]);
    
fwrite($handleimplode(PHP_EOL,$domainArrTmp[1]).PHP_EOL);
}
//file_put_contents('trash.txt',implode('<br>',$domainArr));
fclose($handle);




?>
попробуй xShadow

напарсилось под 100мб - хз чотам дубли не дубли
за наградой кошелёк в личку

Цитата:
Сообщение от MetroJazz Посмотреть сообщение
Блин, закрутился и выпала эта база с головы.

Вот база - http://www.sendspace.com/file/3xxgna
6.8 ляма, от дублей не чистил

Вот скрипт если нужен - http://dumpz.org/487455/
Нужен Python 2.7 + модуль Grab(http://grablib.org/)

Деньги не надо. Сам на днях хотел спарсить этот сайт.
Благодарю

Есть данные на забугор домены? com/us/info?
xShadow вне форума