Чем сравнить два текстовых файла? - Форум успешных вебмастеров - GoFuckBiz.com - Страница 3
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB90.1887
BTC/USD67090.3831
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 13.08.2015, 22:25
Start Post: Чем сравнить два текстовых файла? 
  #21
911neo
Senior Member
 
Регистрация: 03.07.2008
Сообщений: 109
Бабло: $24170
По умолчанию

Имеем два больших текстовых файла - файл1 и файл2. Необходимо сравнить два файла и автоматически удалить из файла1 все строки, которые присутствуют в файле2. Подскажите пожалуйста чем это можно быстрее всего сделать.
911neo вне форума  
Старый 15.08.2015, 00:49   #22
sim0n
zenno.pro
 
Аватар для sim0n
 
Регистрация: 29.05.2014
Сообщений: 961
Бабло: $138858
По умолчанию

Цитата:
Сообщение от ivy Посмотреть сообщение
sim0n, файл на миллиард строк хотя бы сожрет? А насколько оно быстрее fgrep?
он под винду
sim0n вне форума  
Старый 15.08.2015, 00:57   #23
ivy
Senior Member
 
Регистрация: 09.06.2015
Сообщений: 1,027
Бабло: $143960
По умолчанию

sim0n, fgrep тоже в винде работает.
ivy вне форума  
Старый 15.08.2015, 09:36   #24
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,611
Бабло: $760715
По умолчанию

А что за задачи с миллиардами строк?)
Cannabis Cup вне форума  
Старый 15.08.2015, 11:32   #25
ivy
Senior Member
 
Регистрация: 09.06.2015
Сообщений: 1,027
Бабло: $143960
По умолчанию

Cannabis Cup, у меня с кейвордами.
ivy вне форума  
Старый 15.08.2015, 11:43   #26
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,611
Бабло: $760715
По умолчанию

Ну понятно, а в каких тематиках миллиарды кеев ?
Cannabis Cup вне форума  
Старый 15.08.2015, 11:46   #27
ivy
Senior Member
 
Регистрация: 09.06.2015
Сообщений: 1,027
Бабло: $143960
По умолчанию

Обработка баз после парсинга, выборки из общей базы.
ivy вне форума  
Старый 01.09.2015, 19:33   #28
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,611
Бабло: $760715
По умолчанию

А как почистить те же миллионные базы от ру кейвордов? вычистить все строки содержащие кириллические симв. Десктопная софтина какая нить
Cannabis Cup вне форума  
Старый 01.09.2015, 19:43   #29
ivy
Senior Member
 
Регистрация: 09.06.2015
Сообщений: 1,027
Бабло: $143960
По умолчанию

Цитата:
grep -v "[А-Яа-я]" in > out
или так, должно быть сильно быстрее:
Цитата:
LC_ALL=C grep -v "[А-Яа-я]" in > out
ivy вне форума  
Старый 01.09.2015, 20:01   #30
Cannabis Cup
Senior Member
 
Регистрация: 09.07.2014
Сообщений: 5,611
Бабло: $760715
По умолчанию

а кроме грепа? софтверные есть решения?
Cannabis Cup вне форума  
Старый 01.09.2015, 20:11   #31
krob
Senior Member
 
Аватар для krob
 
Регистрация: 29.04.2011
Сообщений: 379
Бабло: $111700
По умолчанию

Цитата:
Сообщение от Cannabis Cup Посмотреть сообщение
а кроме грепа? софтверные есть решения?
да зенка
вот скачать тут можно http://www.zennolab.com/ru/products/...6-2c898690cc1f

рекомендую
krob вне форума