|
| Дата |
|
USD/RUB | 89.2589 | BTC/USD | 68674.6194 |
|
|
|
Скрипты, программы и технические решения Обсуждаем скрипты, программы и новые технологии. |
27.09.2010, 16:46
|
#1
|
чо ваще
Регистрация: 15.07.2009
Сообщений: 116
Бабло: $22245
|
нужно отпарсить и выпарсить
есть база sql размером 3гб
нужно оттуда выпарсить мыльники
чем пользоваться?
|
|
|
27.09.2010, 16:54
|
#2
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,195
Бабло: $247847031
|
mysql+php
|
|
|
27.09.2010, 17:01
|
#3
|
blackseo
Регистрация: 04.04.2007
Адрес: StandAlone
Сообщений: 1,052
Бабло: $196065
|
можно и перл+mysql но в пхп4 mysql вшиты функции - удобно поэтому.
__________________
Возьми домой раненую осу и ты узнаешь, чем платит доброта
|
|
|
27.09.2010, 17:01
|
#4
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,348
Бабло: $470735
|
мыльники - это адреса email ?
тогда grep'ом одна команда над mysql-дампом
или sed'ом можно также
смысла нет в mysql и php
|
|
|
27.09.2010, 17:59
|
#5
|
Мегапихарь
Регистрация: 27.01.2010
Сообщений: 87
Бабло: $15975
|
+1 если база mysql - то просто запрос правильный написать, если все мылы в одном поле, то вообще элементарно, но потом парсить придется:
showmedamoney@workhorse:~$ mysql -ushowmedamoney -p
Enter password:
вбиваешь пасс, заходишь и указываешь куда дампать всё, что ты будешь делать:
mysql> \T /home/showmedamoney/mails.txt
Получаешь ответ: Logging to file 'mails.txt'
Пишешь запрос (возможно он у тебя другой будет):
mysql> select emails from mytable;
после того как закончит:
mysql> quit
Bye
После этого твои три гига уменьшатся и останется написать маленький скриптег на пыхпыхе.
__________________
СелявиСильвуплеДеньгиПокажи
|
|
|
27.09.2010, 18:09
|
#6
|
Мегапихарь
Регистрация: 27.01.2010
Сообщений: 87
Бабло: $15975
|
А, ну, или самое веселое, что-то типа, я точно непомню синтаксис:
mysqldump dbname tablename -w "email<>NULL"> emails.txt
А ты, вообще - спамер, что-ле?
__________________
СелявиСильвуплеДеньгиПокажи
|
|
|
27.09.2010, 18:23
|
#7
|
Ебланнед
Регистрация: 27.10.2009
Сообщений: 1,627
Бабло: $240645
|
Цитата:
Сообщение от ShowMeDaMoney
А ты, вообще - спамер, что-ле?
|
Ему наверное просто любопытно
|
|
|
27.09.2010, 18:25
|
#8
|
Senior Member
Регистрация: 15.11.2008
Сообщений: 13,195
Бабло: $247847031
|
Цитата:
Сообщение от chesser
мыльники - это адреса email ?
тогда grep'ом одна команда над mysql-дампом
или sed'ом можно также
смысла нет в mysql и php
|
ну какбэ да, я привел лишь один из вариантов))
|
|
|
27.09.2010, 18:39
|
#9
|
Мегапихарь
Регистрация: 27.01.2010
Сообщений: 87
Бабло: $15975
|
Да уж, конечно-конечно.
__________________
СелявиСильвуплеДеньгиПокажи
|
|
|
27.09.2010, 18:41
|
#10
|
автоматизирую интернеты
Регистрация: 05.07.2009
Адрес: chesser.ru
Сообщений: 3,348
Бабло: $470735
|
Код:
mysqldump -u user -p dbname | grep -E -o -h '[a-zA-Z]+@([a-zA-Z]+\.)+[a-zA-Z]{2,3}' | tr A-Z a-z | sort | uniq
кто короче?
|
|
|
|