|
| Дата |
|
USD/RUB | 93.7196 | BTC/USD | 64441.2844 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
14.05.2009, 01:42
|
#1
|
Senior Member
Регистрация: 01.02.2008
Сообщений: 473
Бабло: $52717
|
проверка индекации пачки доменов
подскажите какую нибудь бесплатную тулзу для проверки индексации пачки доменов.
|
|
|
14.05.2009, 01:48
|
#2
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,228
Бабло: $247845631
|
PHP код:
<?
set_time_limit(0);
function getIndexedPages($url)
{
$url=str_replace("http://","",$url);
$url=str_replace("www.","",$url);
$file=@file_get_contents("http://yandex.ru/yandsearch?text=&site=$url");
$file = iconv("utf-8","windows-1251",$file);
$yacnta=preg_match("!нашлось(.*?)стран!si",$file,$ok);
$yacnt=$ok[1];
$indexed_pages['yandex'] = trim($yacnt)?trim($yacnt):0;
$file=@file_get_contents("http://nova.rambler.ru/srch?query=+&filter=$url");
$file = iconv("utf-8","windows-1251",$file);
$ramcnta=preg_match("!документов: <b>(.*?)</b>!si",$file,$ok);
$ramcnt=$ok[1];
$indexed_pages['rambler'] = trim($ramcnt)?trim($ramcnt):0;
$file = @file_get_contents("http://www.google.com/search?hl=ru&q=site:$url");
//$file = iconv("utf-8","windows-1251",$file);
//echo $file;
$gogcnta=preg_match("!из(.*?)<b>(.*?)</b> с!si",$file,$ok);
$gogcnt=$ok[2];
$indexed_pages['google'] = trim($gogcnt)?trim($gogcnt):0;
// site:domain.com/&
$file = @file_get_contents("http://www.google.com/search?hl=ru&q=site:$url%2F%26");
//$file = iconv("utf-8","windows-1251",$file);
//echo $file;
$gogcnta=preg_match("!из(.*?)<b>(.*?)</b> с!si",$file,$ok);
$gogcnt=$ok[2];
$indexed_pages['google_base'] = trim($gogcnt)?trim($gogcnt):0;
$file = @file_get_contents("http://sm.aport.ru/scripts/template.dll?That=std&r=URL%3Dwww.$url");
//$file = iconv("utf-8","windows-1251",$file);
//echo $file;
$apcnta=preg_match("!Лучшие(.*?)<b>(.*?)</b>(.*?)\(!si",$file,$ok);
$apcnt=$ok[2];
$indexed_pages['aport'] = trim($apcnt)?trim($apcnt):0;
$file = @file_get_contents("http://siteexplorer.search.yahoo.com/search?p=http%3A%2F%2F$url&y=Explore+URL&fr=sfp");
//$file = iconv("utf-8","windows-1251",$file);
//echo $file;
$yahcnta=preg_match("!Pages \((.*?)\)!si",$file,$ok);
$yahcnt=$ok[1];
$indexed_pages['yahoo'] = trim($yahcnt)?trim($yahcnt):0;
$file = @file_get_contents("http://search.msn.com/results.aspx?q=site%3A$url");
$file = iconv("utf-8","windows-1251",$file);
//echo $file;
$msncnta=preg_match("! из (.*?)</span!si",$file,$ok);
$msncnt=$ok[1];
$indexed_pages['msn'] = trim($msncnt)?trim($msncnt):0;
return $indexed_pages;
}
$urls=$_POST['urls'];
$fromfile=$_POST['fromfile'];
if ($urls||$fromfile==1){
if ($fromfile==1) $urls=file_get_contents('domains');
$urls = preg_split("/[\n\r]+/s", $urls);
foreach($urls as $url) {
if($url){
$idx = getIndexedPages($url);
$txt=" Анализ количества индексированных страниц для ".$url." <br/>";
foreach($idx as $s => $p) $txt.=" $s = $p <br/>";
echo "$txt <br/><br/>";}
}
}
?>
<form method=post>
Правила - 1-на строка -- 1-н домен и ниибет, количество доменов ограничивает жадность и пхп тайм лимит сервера.
<textarea name=urls cols=80 rows=10> </textarea><br/>
<input type=checkbox name=fromfile value=1> - если стоит эта галка, то побарабану что написано сверху, а данные берутся из файла domains
<br/>
<br/>
<input type=submit value="Послать">
</form>
|
|
|
14.05.2009, 02:24
|
#3
|
Senior Member
Регистрация: 01.02.2008
Сообщений: 473
Бабло: $52717
ТС -->
|
ТС
спасибо
|
|
|
14.05.2009, 08:28
|
#4
|
саловер
Регистрация: 17.04.2007
Сообщений: 3,265
Бабло: $302675
|
|
|
|
14.05.2009, 09:50
|
#5
|
Senior Member
Регистрация: 28.04.2007
Сообщений: 1,564
Бабло: $190592
|
imgreen, может стоит добавить к
Цитата:
"http://www.google.com/search?hl=ru&q=site:$url%2F%26"
|
еще &num=100&start=900
т.е.
Код:
"http://www.google.com/search?hl=ru&num=100&start=900&q=site:$url%2F%26"
т.к. если страниц проиндексированно больше чем отображается на одной странице выдачи, гугл в общем количестве на первой странице выдает совершенно левые цифры.
|
|
|
|