Сортировка файлов по содержанию, подскажите софт. - Форум успешных вебмастеров - GoFuckBiz.com - Страница 2
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Бизнес-решения > Скрипты, программы и технические решения
Дата
USD/RUB88.4375
BTC/USD67361.9862
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии.

Закрытая тема
Опции темы Опции просмотра
Старый 08.10.2011, 21:05
Start Post: Сортировка файлов по содержанию, подскажите софт. 
  #11
Boddhisatva
Добрых дел мастер
 
Аватар для Boddhisatva
 
Регистрация: 05.12.2009
Адрес: Tibet
Сообщений: 963
Бабло: $145785
По умолчанию

Привет.
Задача стоит следующая - рассортировать 50к html файлов по признакам, которые находятся в их содержании.

Например, если содержиться слово "Mixer", "BOSH", и "2006" - перемещаем файл в папку /mixers/bosh/2006/.

Вся эта информация, кстати, содержится в первой строке в большинстве файлов.

Кто сталкивался с подобным - подскажите софт? Вручную всё это делать - не очень радужная перспектива.

KTHNX!
Boddhisatva вне форума  
Старый 15.10.2011, 13:44   #12
greenwar
Ебланнед
 
Регистрация: 07.02.2010
Сообщений: 1,052
Бабло: $119555
По умолчанию

1.в регулярку любой текст можно загнать, если ты знаешь ориентиры, какие искать
но если ты их не знаешь, то задачи считай и нету
так что см.п1

Цитата:
В конец имени каждого файла, перед расширением, добавить первую строчку из него же.
как обычно - звучит всё элементарно, а на деле баксов на 300 еботни
__________________
напоминание для медара, ругающего сыроедение и ноющего про Б12: 1, 2, 3, 4
greenwar вне форума  
Старый 15.10.2011, 14:23   #13
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

Boddhisatva, ты писал в файле строка вида
"БРЕНД%пробел%МАРКА%пробел%ГОД"
Также ты написал что БРЕНДЫ есть отдельно в файле.
И регулярка
PHP код:
"/".$value_brand."\s(.*)\s(.*)/" 
с подставкой брендов должна выпарсить такую строку, по идее.
Привел бы пример реальных строк из файлов, пару-тройку штук, стало все бы намного яснее.

ПС от вирусов запускай в песочнице - sandboxie
incognito вне форума  
Старый 15.10.2011, 20:00   #14
greenwar
Ебланнед
 
Регистрация: 07.02.2010
Сообщений: 1,052
Бабло: $119555
По умолчанию

Цитата:
"/".$value_brand."\s(.*)\s(.*)/"
тут ашипка. регулярки работают по "жадному" принципу
возьмёт твой первый (.*) и растянет до конца строки, сожрав все пробелы и символы
надо (.*)?
и ещё, не знаю, как там в пхп, но в перле эти кавычки и вставка, со слиянием через точки, не нужна
__________________
напоминание для медара, ругающего сыроедение и ноющего про Б12: 1, 2, 3, 4
greenwar вне форума  
Старый 15.10.2011, 20:23   #15
incognito
Senior Member
 
Аватар для incognito
 
Регистрация: 08.07.2007
Сообщений: 177
Бабло: $34565
По умолчанию

Цитата:
Сообщение от greenwar Посмотреть сообщение
тут ашипка. регулярки работают по "жадному" принципу...
да ошибся, спасибо!
incognito вне форума  
Старый 15.10.2011, 22:12   #16
chesser
автоматизирую интернеты
 
Аватар для chesser
 
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,356
Бабло: $470735
По умолчанию

Цитата:
Сообщение от incognito Посмотреть сообщение
да ошибся, спасибо!
а вроде не ошибся, если так написать:
Цитата:
preg_match_all("/$value_brand\s*(.*)\s*(.*)/Uis", $str, $out);
__________________
USA и NL серверы и VPS | wiki | блог | Drupal | NginxТДС
Ave, Google, morituri te salutant! © chesser
chesser вне форума