нужен скрипт, за плату - Форум успешных вебмастеров - GoFuckBiz.com
 
 
Форум успешных вебмастеров - GoFuckBiz.com

  Форум успешных вебмастеров - GoFuckBiz.com > Разное > Объявления о покупке/продаже товаров и услуг
Дата
USD/RUB93.4409
BTC/USD64097.0602
Объявления о покупке/продаже товаров и услуг Также в этом разделе следует размещать и предложения о сотрудничестве.

Закрытая тема
Опции темы Опции просмотра
Старый 31.12.2012, 12:58   #1
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 32
Бабло: $7895
По умолчанию нужен скрипт, за плату

Есть текст
Код:
...
9|"http://domain.com"
0|http://domain.com/
1|http://twitter.com/index.html
2|http://yahoo.com.com/query.php?query=yahoo
3|http://domain.com/index.php?get=someget
4|http://www.google.com/index.htm
5|http://www.facebook.com/index.php
6|http://domain.com/w21d32/index.html?get=23
7|http://facebook.com/permalink.php?story_fbid=273
8|http://domaincrawler.com/domain.com/
countend
10|"http://domain2.com"
0|http://twitter.com/index.html
1|http://domain2.com/
2|http://www.facebook.com/index.php
3|http://domain2.com/index.htm
4|http://domain2.com/index.php?get=someget
5|http://domaincatalog.com/domain2.com/
6|http://yahoo.com.com/query.php?query=yahoo
7|http://domain2.com/w21d32/index.html?get=23
8|http://facebook.com/permalink.php?story_fbid=273
9|http://www.google.com/index.htm
countend
..
Множество диапазонов строк от URL в кавычках до countend. Нужно из диапазона убрать строки содержащие domain.com (URL в кавычках без http://), оставив строку с URL в кавычках.

Цена: 10WMZ.

Всемх с новым годом 8)!
Pakotorn вне форума  
Старый 01.01.2013, 19:30   #2
Barbados
Senior Member
 
Аватар для Barbados
 
Регистрация: 01.02.2008
Адрес: Perm
Сообщений: 627
Бабло: $18225
По умолчанию

Код:
#!/usr/bin/python2.6
# -*- coding: utf-8 -*-
import os, sys, re

in_file = 'text.txt'
out_file = 'text2.txt'

txt = open(in_file).read()


m = re.findall(r'(?ism)(\d*?)\|"http:\/\/(.*?)"\n(.*?)countend', txt)

if m:
	for cn in m:
		ln = str(cn[2]).strip().split("\n")
		i = len(ln)-1
		lout = ''
		while i:
			if not cn[1] in ln[i]:
				lout += ln[i] + "\n"
			i -= 1
		fp = open(out_file, "a")
		print>>fp, cn[0] + '|"http://'+ cn[1] +'"\n' +  lout + "countend"
		fp.close()
левый файл входной, правый - выходной


все верно?
Barbados вне форума  
Старый 01.01.2013, 21:04   #3
Алёша
Ебланнед
 
Регистрация: 30.03.2012
Сообщений: 176
Бабло: $177310
По умолчанию

perl -ne 'next if/\|http:\/\/domain\.com/;print' исходный_файл.txt
Алёша вне форума  
Старый 01.01.2013, 21:07   #4
Tosser
Yea!
 
Аватар для Tosser
 
Регистрация: 15.02.2008
Сообщений: 2,325
Бабло: $313955
По умолчанию

10$ можешь мне отправить
__________________
Tosser вне форума  
Старый 01.01.2013, 22:20   #5
creator123
Senior Member
 
Аватар для creator123
 
Регистрация: 05.01.2008
Сообщений: 1,676
Бабло: $213930
По умолчанию

Цитата:
Сообщение от Barbados
python2.6
Цитата:
Сообщение от Tosser
perl
значит перл круче
creator123 вне форума  
Старый 02.01.2013, 00:26   #6
Barbados
Senior Member
 
Аватар для Barbados
 
Регистрация: 01.02.2008
Адрес: Perm
Сообщений: 627
Бабло: $18225
По умолчанию

Цитата:
Сообщение от creator123 Посмотреть сообщение
значит перл круче
а кто круче, лыжник или сноубордист?)))
вечный спор
Barbados вне форума  
Старый 02.01.2013, 08:37   #7
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 32
Бабло: $7895
ТС -->
автор темы ТС По умолчанию

Barbados, извинсь что не сразу отписал, отходил от НГ, напиши свой кошель в личку
Pakotorn вне форума  
Старый 02.01.2013, 15:26   #8
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 32
Бабло: $7895
ТС -->
автор темы ТС По умолчанию

Цитата:
Сообщение от Алёша Посмотреть сообщение
perl -ne 'next if/\|http:\/\/domain\.com/;print' исходный_файл.txt
Мне надо чтоб много доменов убрал,а не один, так я и grepом мог бы
Pakotorn вне форума  
Старый 02.01.2013, 19:30   #9
Pakotorn
Member
 
Регистрация: 18.07.2012
Сообщений: 32
Бабло: $7895
ТС -->
автор темы ТС По умолчанию

Надеюсь оплата прошла, спасибо за оперативность, но большие файлы обрабатывать отказывается (
Цитата:
./200.py
Traceback (most recent call last):
File "./200.py", line 8, in <module>
txt = open(in_file).read()
MemoryError

Последний раз редактировалось Pakotorn; 02.01.2013 в 19:44.
Pakotorn вне форума  
Старый 02.01.2013, 20:15   #10
Barbados
Senior Member
 
Аватар для Barbados
 
Регистрация: 01.02.2008
Адрес: Perm
Сообщений: 627
Бабло: $18225
По умолчанию

свяжись плз со мной icq 213335
Barbados вне форума