Есть ли программа для отбора кейвордов? - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.2486
BTC/USD69166.7747
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 21.08.2020, 13:18   #1
disqus
Senior Member
 
Аватар для disqus
 
Регистрация: 29.08.2016
Сообщений: 1,616
Бабло: $323550
По умолчанию Есть ли программа для отбора кейвордов?

Столкнулся с проблемой, что из всех мною найденных программистов в интернете, никто не знает, как отобрать кейворды из 1 файла, которые не повторялись бы с кейвордами во втором файле и сохранились бы в третьем файле.

Звучит вроде так елементарно.. но никто не может сделать... это реально неподсильная задача?
disqus вне форума  
Старый 21.08.2020, 13:46   #2
Vardy
Krumm
 
Аватар для Vardy
 
Регистрация: 23.04.2016
Сообщений: 823
Бабло: $100900
По умолчанию

disqus, если не ошибаюсь то такое можно сделать даже с помощью макросов или формулы в обычном Excel. Дрочил по екселю я думаю ты знаешь где искать)
Vardy вне форума  
Старый 21.08.2020, 14:07   #3
digg
$400
 
Аватар для digg
 
Регистрация: 17.05.2009
Сообщений: 14,034
Бабло: $1904260
Отправить сообщение для digg с помощью ICQ
По умолчанию

если файл сильно большой, то эксель задрочится
файлы большие то?
digg вне форума  
Старый 21.08.2020, 14:07   #4
Novgorodcev
Юниор
 
Аватар для Novgorodcev
 
Регистрация: 05.07.2020
Сообщений: 11
Бабло: $3150
По умолчанию

в линуксе 8 строк получилось

Цитата:
while IFS= read -r line
do
RESULT=$(grep "$line" key2.txt)
if [ "$RESULT" == "" ]
then
echo "$line" >>key3.txt
fi
done < key1.txt
первый файл key1.txt
то в котором ищем дубли key2.txt
результат получаем в key3.txt
Novgorodcev вне форума  
Старый 21.08.2020, 14:07   #5
excl
Senior Member
 
Аватар для excl
 
Регистрация: 24.06.2007
Сообщений: 5,036
Бабло: $3620041
По умолчанию

В кейколлекторе, используя папки, можно такое осуществить. Сначала загружается второй файл в отдельную папку, потом первый файл в отдельную папку. Все дубли чистятся автоматически. В итоге во второй папке имеем то, что тебе надо в третьем файле.
excl на форуме  
Старый 21.08.2020, 14:41   #6
Krok
Senior Member
 
Аватар для Krok
 
Регистрация: 02.03.2014
Сообщений: 485
Бабло: $84835
Отправить сообщение для Krok с помощью Telegram Отправить сообщение для Krok с помощью Skype™
По умолчанию

в textpipe сделать фильтр
Krok вне форума  
Старый 21.08.2020, 15:39   #7
disqus
Senior Member
 
Аватар для disqus
 
Регистрация: 29.08.2016
Сообщений: 1,616
Бабло: $323550
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Novgorodcev Посмотреть сообщение
в линуксе 8 строк получилось

Цитата:
while IFS= read -r line
do
RESULT=$(grep "$line" key2.txt)
if [ "$RESULT" == "" ]
then
echo "$line" >>key3.txt
fi
done < key1.txt
первый файл key1.txt
то в котором ищем дубли key2.txt
результат получаем в key3.txt
я так и не дождался окончания работы скрипта.. 2 часа висел в обработке 500 тысяч строчек...

неужели дорвейщики задрачивают одни и теже кейворды каждый раз?...
disqus вне форума  
Старый 21.08.2020, 16:14   #8
веломан
сыроед
 
Аватар для веломан
 
Регистрация: 01.10.2015
Сообщений: 15,877
Бабло: $1862895
По умолчанию

Цитата:
Сообщение от disqus
я так и не дождался окончания работы скрипта.. 2 часа висел в обработке 500 тысяч строчек...
выпили из файлов строчек 10 и проверь
через tail можно откусить
а вообще 500000 запустить grep на файл из 500000 строк это всё равно долго...
надо другой алгоритм
веломан вне форума  
Старый 21.08.2020, 16:30   #9
Novgorodcev
Юниор
 
Аватар для Novgorodcev
 
Регистрация: 05.07.2020
Сообщений: 11
Бабло: $3150
По умолчанию

по 500К думаю да, grep будет долго )))

хотя посмотри сколько в третьем файле вышло - может чутка не дождался.

а точные размеры файлов 1 и 2 построчно можешь сказать?
Novgorodcev вне форума  
Старый 21.08.2020, 16:43   #10
disqus
Senior Member
 
Аватар для disqus
 
Регистрация: 29.08.2016
Сообщений: 1,616
Бабло: $323550
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Novgorodcev Посмотреть сообщение
по 500К думаю да, grep будет долго )))

хотя посмотри сколько в третьем файле вышло - может чутка не дождался.

а точные размеры файлов 1 и 2 построчно можешь сказать?
я не знаю сколько не дождался ))

там 6тысяч строчек в результате.

где ссылки - 800 тысяч строчек

а кейворды - 230 тысяч строчек.
disqus вне форума