Удаление дублей по доменному имени. - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.4082
BTC/USD69928.3605
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 22.04.2011, 20:31
Start Post: Удаление дублей по доменному имени. 
  #11
Syncmaster
$ $ $
 
Аватар для Syncmaster
 
Регистрация: 29.12.2007
Сообщений: 323
Бабло: $118140
Question

Подскажите чем можно удалить дубли по доменному имени.
__________________
Syncmaster вне форума  
Старый 22.04.2011, 21:59   #12
jarosek
jaros
 
Аватар для jarosek
 
Регистрация: 10.05.2009
Адрес: Киев
Сообщений: 1,498
Бабло: $221845
Отправить сообщение для jarosek с помощью Telegram Отправить сообщение для jarosek с помощью Skype™
По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
PHP код:
<?php
###########################################
## удаление дублей по хосту subdomain.domain.ext,
## те
## subdomain.domain.ext и subdomain1.domain.ext
## будут считаться уникальными
###########################################
set_time_limit(300);
$urls file('urls.txt',FILE_IGNORE_NEW_LINES);

$unic_urls = array();
foreach (
$urls as $value){
    
$url_parts parse_url($value);
    if (
strpos($url_parts['host'],'www.')==0$domain str_replace('www.','',$url_parts['host']);
    
    if (!
array_key_exists($domain,$unic_urls)){
        
$unic_urls[$domain] = $value;
    }else{
        
$non_unic_urls[] = $domain.'=>'.$value;
    }
}

file_put_contents('unic-urls.txt',implode("\r\n",$unic_urls));
sort($non_unic_urls);
file_put_contents('non-unic-urls.txt',implode("\r\n",$non_unic_urls));

?>
а разве array_unique не справится?код в пару строк...
jarosek вне форума  
Старый 22.04.2011, 22:06   #13
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

Цитата:
Сообщение от jarosek Посмотреть сообщение
а разве array_unique не справится?код в пару строк...
по умолчанию я предположил, что в исходнике не уникальные урлы, а урлы с одинаковым хостом, но разным путем (например один форум, но разные топы).
incognito вне форума  
Старый 22.04.2011, 22:47   #14
jarosek
jaros
 
Аватар для jarosek
 
Регистрация: 10.05.2009
Адрес: Киев
Сообщений: 1,498
Бабло: $221845
Отправить сообщение для jarosek с помощью Telegram Отправить сообщение для jarosek с помощью Skype™
По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
по умолчанию я предположил, что в исходнике не уникальные урлы, а урлы с одинаковым хостом, но разным путем (например один форум, но разные топы).
ну он же написал что по домену
вобщем вот по домену
PHP код:
<?php
$file_domens 
file('domains.txt');
$unique array_unique($file_domens);
foreach(
$unique as $key){
    
$open fopen('unique_domains.txt',"a+"); 
    
fwrite($open,$key); 
    
fclose($open);
}
?>
это если в списке тупо домены, тоесть одного вида url.com или www.url.com

Последний раз редактировалось jarosek; 22.04.2011 в 22:56.
jarosek вне форума  
Старый 22.04.2011, 22:56   #15
LeXxiK
Senior Member
 
Аватар для LeXxiK
 
Регистрация: 03.03.2008
Сообщений: 2,274
Бабло: $263105
По умолчанию

ну я например имел в виду то же, что и инкогнито
есть список урлов, в которых присутствуют одинаковые домены, в результате должны получить список урлов без повторов доменов
jarosek, это не по домену, а просто по уникальной строке
incognito, спасибо
LeXxiK вне форума  
Старый 22.04.2011, 22:56   #16
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

Цитата:
Сообщение от jarosek Посмотреть сообщение
ну он же написал что по домену
вобщем вот по домену...
тогда бы он скорее назвал уникально по строке
и "\n" лишнее

опоздал бл...
incognito вне форума  
Старый 22.04.2011, 22:58   #17
jarosek
jaros
 
Аватар для jarosek
 
Регистрация: 10.05.2009
Адрес: Киев
Сообщений: 1,498
Бабло: $221845
Отправить сообщение для jarosek с помощью Telegram Отправить сообщение для jarosek с помощью Skype™
По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
тогда бы он скорее назвал уникально по строке
и "\n" лишнее
ага, я просто не понял толком какого вида списокдумал у него простая задача...
лексик, обновил пост
про \n завтыкал, убрал когда увидел)
jarosek вне форума  
Старый 23.04.2011, 07:48   #18
Syncmaster
$ $ $
 
Аватар для Syncmaster
 
Регистрация: 29.12.2007
Сообщений: 323
Бабло: $118140
ТС -->
автор темы ТС По умолчанию

Всем спасибо
__________________
Syncmaster вне форума  
Старый 23.04.2011, 10:48   #19
Сварщик
Директор Тольятти
 
Аватар для Сварщик
 
Регистрация: 08.05.2010
Сообщений: 754
Бабло: $116155
По умолчанию

попробуй это там сервисе имеется удаление повторов
Сварщик вне форума  
Старый 23.04.2011, 16:41   #20
tobari
Senior Member
 
Регистрация: 03.09.2010
Сообщений: 827
Бабло: $99806
По умолчанию

Цитата:
Сообщение от jarosek Посмотреть сообщение
ну он же написал что по домену
вобщем вот по домену
PHP код:
<?php
$file_domens 
file('domains.txt');
$unique array_unique($file_domens);
foreach(
$unique as $key){
    
$open fopen('unique_domains.txt',"a+"); 
    
fwrite($open,$key); 
    
fclose($open);
}
?>
это если в списке тупо домены, тоесть одного вида url.com или www.url.com
тогда уж лучше вот так
PHP код:
<?php
$file_domens 
file('domains.txt');
$unique array_unique($file_domens);
$open fopen('unique_domains.txt',"a+");
foreach(
$unique as $key){ 
    
fwrite($open,$key); 
}
fclose($open);
?>
tobari вне форума  
Старый 23.04.2011, 18:28   #21
R@mire(
Lurker
 
Аватар для R@mire(
 
Регистрация: 12.11.2010
Адрес: UA
Сообщений: 201
Бабло: $28455
По умолчанию

Цитата:
Сообщение от Syncmaster
Подскажите чем можно удалить дубли по доменному имени.
http://solutionfix.org/soft/doublers/
R@mire( вне форума