|
| Дата |
|
USD/RUB | 93.4409 | BTC/USD | 66775.6648 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
22.04.2011, 20:31
|
#1
|
$ $ $
Регистрация: 29.12.2007
Сообщений: 323
Бабло: $118140
|
Удаление дублей по доменному имени.
Подскажите чем можно удалить дубли по доменному имени.
__________________
|
|
|
22.04.2011, 20:36
|
#2
|
Senior Member
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
|
хрумером можно
нет ни у кого пхп скрипта кстати? а то хрумер блюёт от больших файлов)
|
|
|
22.04.2011, 20:44
|
#3
|
$ $ $
Регистрация: 29.12.2007
Сообщений: 323
Бабло: $118140
ТС -->
|
ТС
Чет не охото хрумер покупать что бы дубли убирать.
А это в демке есть? А сейчас вобще демка есть или уже нет?
__________________
|
|
|
22.04.2011, 20:49
|
#4
|
Senior Member
Регистрация: 28.05.2009
Сообщений: 1,321
Бабло: $164090
|
Да, есть.
|
|
|
22.04.2011, 21:04
|
#5
|
Senior Member
Регистрация: 22.08.2008
Сообщений: 927
Бабло: $173840
|
|
|
|
22.04.2011, 21:15
|
#6
|
Senior Member
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
|
dim7, это чё-то ваще не то)
|
|
|
22.04.2011, 21:32
|
#7
|
$ $ $
Регистрация: 29.12.2007
Сообщений: 323
Бабло: $118140
ТС -->
|
ТС
Цитата:
Сообщение от 1een
Да, есть.
|
нашел, но что-то она под 7ку не запускается никак )
__________________
|
|
|
22.04.2011, 21:33
|
#8
|
Senior Member
Регистрация: 22.08.2008
Сообщений: 927
Бабло: $173840
|
Цитата:
Сообщение от LeXxiK
dim7, это чё-то ваще не то)
|
кайзеровский бейзедитор точно поможет.
или этот код, но не помню толи первый толи второй
Код:
#!/usr/local/bin/perl -U
sub f_fread{
my$n=shift;
open f,$n;
sysread f,$t,(stat f)[7];
close f;
$t}
sub f_fwrite{
my$t=shift;
my$n=shift;
open f,">$n";
syswrite f,$t,length$t;
close f}
$A=$ARGV[0];
map{$n=$_;$n=~s/^([^\/]+\/\/[^\/]+).*/$1/os;$H{$n}=$_}split/\r?\n/,f_fread($A);
f_fwrite(join("\n",sort values%H)."\n","$A.new");
__END__
Код:
#!/usr/local/bin/perl -U
sub f_fread{
my$n=shift;
open f,$n;
sysread f,$t,(stat f)[7];
close f;
$t}
sub f_fwrite{
my$t=shift;
my$n=shift;
open f,">$n";
syswrite f,$t,length$t;
close f}
$A=$ARGV[0];
map{$H{$_}=1}split/\r?\n/,f_fread($A);
$f=join("\n",sort keys%H)."\n";
f_fwrite($f,"$A.new");
__END__
|
|
|
22.04.2011, 21:34
|
#9
|
Senior Member
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
|
PHP код:
<?php
###########################################
## удаление дублей по хосту subdomain.domain.ext,
## те
## subdomain.domain.ext и subdomain1.domain.ext
## будут считаться уникальными
###########################################
set_time_limit(300);
$urls = file('urls.txt',FILE_IGNORE_NEW_LINES);
$unic_urls = array();
foreach ($urls as $value){
$url_parts = parse_url($value);
if (strpos($url_parts['host'],'www.')==0) $domain = str_replace('www.','',$url_parts['host']);
if (!array_key_exists($domain,$unic_urls)){
$unic_urls[$domain] = $value;
}else{
$non_unic_urls[] = $domain.'=>'.$value;
}
}
file_put_contents('unic-urls.txt',implode("\r\n",$unic_urls));
sort($non_unic_urls);
file_put_contents('non-unic-urls.txt',implode("\r\n",$non_unic_urls));
?>
|
|
|
22.04.2011, 21:51
|
#10
|
Senior Member
Регистрация: 11.10.2008
Сообщений: 6,409
Бабло: $904273
|
юзаю YCCY , но он отдаёт только доменые имена
|
|
|
|